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VORWORT ZUR DRITTEN AUFLAGE 


Die sieben Jahre, die seit Erscheinen der zweiten sowjetischen Auflage dieses 
Buches vergangen sind, brachten nicht nur der Entwicklung der Wahrschein- 
lichkeitsrechnung als mathematischer Wissenschaft bedeutenden Erfolg, sondern 
auch der Erweiterung und Vertiefung ihrer Verbindung mit der Praxis sowie den 
Ansichten über den Charakter der Darstellung dieser Disziplin. In diesem Zeit- 
raum erschien eine große Anzahl interessanter grundlegender Lehrbücher für 
Studenten und Aspiranten an den Universitäten. In erster Linie möchte ich auf 
solche Bücher hinweisen wie: 


M. Lo&ve, Probability theory, New York 1955; 

O. Onzozscv, G. Mimoc, C.T. Ionescu TuLcea, Caleul probabilitä tilor si 
aplicatii, Bucuresti 1956; 

A. Renyı, Wahrscheinlichkeitsrechnung, Berlin 1962; 

H. Rıc#rerR, Wahrscheinlichkeitstheorie, Berlin/Göttingen/Heidelberg 1956; 


M. Fısz, Wahrscheinlichkeitsrechnung und mathematische Statistik, Berlin 
1962. 


Die Bücher von M. Lotve und H. RıcaTer bringen die Wahrscheinlichkeits- 
rechnung im Sinne einer abstrakten mathematischen Theorie ohne Bezug auf 
die anschaulichen Vorstellungen und die Behandlung angewandter Beispiele. 
Ich finde, daß Bücher solcher Richtung notwendig sind. Die erste Bekanntschaft 
mit der Wahrscheinlichkeitsrechnung sollte jedoch auf der Grundlage anschau- 
licher Vorstellungen und unter ständiger Betonung der Vielfalt ihrer Verbin- 
dungen mit der Naturwissenschaft, Technik und anderen Tätigkeitsbereichen 
des Menschen stattfinden. Deshalb bin ich auch in dieser Auflage weder von 
meinem Stil der Darstellung noch von den methodologischen Bestrebungen ab- 
gegangen. 

Im Vergleich zur zweiten Auflage hat sich das Buch etwas verändert. Es sind 
darin neue Paragraphen hinzugekommen, bei anderen wurde der Inhalt etwas 
erweitert, und einige festgestellte Druck- und Schreibfehler wurden korrigiert. 


Gleichzeitig hielt ich es für notwendig, den kurzen historischen Abriß am 
Schluß des Buches gegenüber der zweiten Auflage etwas zu verändern und 
einige Abschnitte neu zu formulieren. Aus zeitlichen Gründen war es mir jedoch 


VI Vorwort zur dritten Auflage 


nicht möglich, die Geschichte der Wahrscheinlichkeitsrechnung bis in unsere 
Tage zu verfolgen, so daß ich mich auf die Anfänge ihrer Entwicklung be- 
schränkt habe. 


Ich danke herzlich allen Lesern, die sich die Zeit genommen haben, mir Fehler 
in der zweiten Auflage mitzuteilen. Ich war nach besten Kräften bestrebt, die 
mir gegebenen Ratschläge auszuwerten. Sehr dankbar wäre ich, wenn mir auch 
dieses Mal die Leser ihre Wünsche, kritischen Anregungen und Hinweise auf 
festgestellte Fehler in der Darstellung mitteilten. 


Moskau, im März 1962 B. GNEDENKO 


VORWORT ZUR ZWEITEN AUFLAGE 


Die vorliegende Auflage unterscheidet sich beträchtlich von der ersten. Ich 
habe mich bemüht, die Bemerkungen und Wünsche möglichst vollständig zu 
berücksichtigen, die in den Rezensionen zur ersten Auflage enthalten waren 
oder mir brieflich und mündlich mitgeteilt wurden. Die wesentlichste Ver- 
änderung besteht wohl darin, daß den ersten neun Kapiteln Übungsaufgaben 
hinzugefügt wurden. Außerdem habe ich mich entschlossen, die Anhänge weg- 
zulassen. Anhang I ging in den Text des ersten, vierten und fünften ‚Kapitels 
über. Es wurden auch einige weitere Veränderungen an diesen Kapiteln 
vorgenommen. Beträchtlich erweitert wurde das Kapitel IX, in dem vor 
allem die Theorie der stationären zufälligen Prozesse ausführlicher dargestellt 
wurde. Einer bedeutenden Veränderung wurde auch das letzte Kapitel unter- 
zogen, das der mathematischen Stat’stik gewidmet ist. In diesem Kapitel gibt 
es einige neue Paragraphen, während ein Teil des Stoffes, der in der ersten 
Auflage enthalten war, weggelassen wurde. So wurde z.B. der komplizierte 
Beweis des Satzes von KoLMoGoRoOFF über die Grenzverteilung für das Maximum 
der Abweichung der empirischen Verteilungsfunktion von der wahren unter- 
drückt. Weggelassen wurde ferner der Paragraph über Sequentialanalyse. Die 
in der ersten Auflage festgestellten Versehen und Fehler wurden verbessert. 

Ich benutze die Gelegenheit, um den Kollegen herzlich zu danken, die offen 
ihre Meinung über die Mängel dieses Buches geäußert und durch ihre Kritik 
zu ihrer Verbesserung beigetragen haben. Besonderen Dank schulde ich 
J. W. LisnIk für sein beständiges Interesse an diesem Buch und für die Dis- 
kussion des Manuskripts zur zweiten Auflage. 

Ich weiß, daß dieses Buch auch in der jetzigen Form nicht frei von Mängeln 
ist; daher wende ich mich an den Leser mit der Bitte, mir alle Unzulänglich- 
keiten der zweiten Auflage sowie Wünsche bezüglich des Inhaltes und der Dar- 
stellung des Stoffes mitzuteilen. Ich werde jedem dankbar sein, der mir inter- 
essante Aufgaben zur Verwendung in diesem Lehrbuch mitteilt. 


B. GNEDENKO 


AUS DEM VORWORT ZUR ERSTEN AUFLAGE 


Dieser Lehrgang besteht aus zwei Teilen, einem elementaren (Kapitel I—VI) 
und einem speziellen (Kapitel VII—XI). Die letzten fünf Kapitel können als 
Grundlage dienen zu Spezialstudien über die Theorie von Summen zufälliger 
Größen, die Theorie der stochastischen Prozesse und die Elernente der mathe- 
matischen Statistik. 

Die Wahrscheinlichkeitsrechnung wird in diesem Buch ausschließlich als 
mathematische Disziplin betrachtet. Daher ist die Darstellung konkreter natur- 
wissenschaftlicher und technischer Resultate hier niemals Selbstzweck. Alle 
Beispiele im Text des Buches sollen nur die Sätze der allgemeinen Theorie 
erläutern und auf den Zusammenhang dieser Sätze mit den Aufgaben der Natur- 
wissenschaft hinweisen. Natürlich geben diese Beispiele zugleich Hinweise auf 
mögliche Anwendungsgebiete der allgemeinen theoretischen Resultate und ent- 
wickeln die Fähigkeit, diese Resultate bei praktischen Aufgaben anzuwenden. 
Eine solche Studienweise gibt dem Leser die Möglichkeit, sich eine eigentüm- 
liche wahrscheinlichkeitstheoretische Intuition zu erarbeiten, die es gestattet, 
die Ergebnisse in großen Zügen vorherzusehen, noch ehe der analytische Appa- 
rat angewendet wird. Wir bemerken noch, daß es, besonders am Anfang, 
unmöglich ist, die Wahrscheinlichkeitsrechnung ohne systematische Lösung 
von Aufgaben zu studieren. 

Die ersten vier Paragraphen des ersten Kapitels stellen eine geringfügige 
Überarbeitung eines unveröffentlichten Manuskripts von A. N. KOLMOGOROFF 
dar. 

Ich bin glücklich, an dieser Stelle meinen verehrten Lehrern A. N. KoLmo- 
GOROFF und A. J. CHiwtscHin danken zu können, die mir durch ihren Rat und 
Unterredungen über die Kernfragen der Wahrscheinlichkeitsrechnung viel 
geholfen haben. 


B. GNEDENKoO 


VORWORT DES VERFASSERS 
ZUR ERSTEN DEUTSCHEN AUFLAGE 


Im Frühjahr 1954 hielt ich als Gastprofessor an der Humboldt-Universität zu 
Berlin Vorlesungen über Wahrscheinlichkeitsrechnung. Zur gleichen Zeit be- 
reitete ich die zweite (russische) Auflage des vorliegenden Lehrbuches vor. 
Deutsche Kollegen machten mir den Vorschlag, dieses Lehrbuch in die deutsche 
Sprache zu übersetzen, und das Forschungsinstitut für Mathematik der Deut- 
schen Akademie der Wissenschaften und der Akademie-Verlag haben sich 
freundlicherweise bereit erklärt, die Herausgabe der Übersetzung zu besorgen. 

Mein Hörer und Schüler WoLraAnG RICHTER — damals Student der Humboldt- 
Universität — fertigte die Übersetzung an. Herr Haus Joachım RossBERG — 
wissenschaftlicher Assistent an der Deutschen Akademie der Wissenschaften — 
übernahm die Redaktionsarbeit. Er führte diese Arbeit mit der größten Sorg- 
falt durch, überarbeitete den deutschen Text und überprüfte Formeln und 
rechnerische Ableitungen. Dabei hat er eine Reihe von Rechenfehlern fest- 
stellen und beheben können; seine diesbezüglichen Hinweise habe ich auch bei 
der Herausgabe der zweiten russischen Auflage berücksichtigt. Ich möchte 
hiermit dem Forschungsinstitut für Mathematik der Deutschen Akademie der 
Wissenschaften, dem Akademie-Verlag und den genannten Kollegen für ihre 
Mühe und ihre sorgfältige Arbeit meinen herzlichsten Dank aussprechen. 

Das vorliegende Lehrbuch ist nur eine elementare Einleitung in die Wahr- 
scheinlichkeitsrechnung. Dies rechtfertigt zum Teil die Tatsache, daß einige 
wichtige Gebiete (wie z. B. Markowsche Ketten) nur kurz, andere überhaupt 
nicht behandelt werden. Andererseits glaube ich, daß es für den angehenden 
Mathematiker wichtig ist, Verbindungen zwischen verschiedenen mathe- 
matischen Disziplinen und den Zusammenhang zwischen Mathematik und 
Praxis zu erkennen. Ich habe mich bemüht, diese Seite möglichst klar heraus- 
treten zu lassen. Diesem Zweck dienen u. a. verschiedene im Text behandelte 
Beispiele und dem Leser empfohlene Aufgaben, von denen viele angewandten 
Charakter haben. Doch möchte ich gleich bemerken, daß diese Beispiele und 
Aufgaben hier nur zur Illustration der Theorie dienen und keinen Anspruch er- 
heben, dern Leser konkrete Kenntnisse über Anwendungen der Wahrscheinlich- 
keitsrechnung in Naturwissenschaften und Technik zu vermitteln. Es kommt 
noch hinzu, daß wichtige Anwendungsgebiete der Wahrscheinlichkeitsrechnung 
in dem Buch nicht einmal erwähnt worden sind. 


B.€ Vorwort des Verfassers zur ersten deutschen Ausgabe 


Eingehende Kenntnisse über die in dem Lehrbuch angeschnittenen Gebiete 
können nur durch das Studium der entsprechenden Zeitschriftenliteratur und 
Monographien erworben werden. Für die Theorie der stochastischen Prozesse 
möchte ich in erster Linie auf die ausführlichen Bücher von A. BLAnc-LAPIERRE 
und R. FoRTET und von J. L. Doos sowie auf den ausgezeichneten Artikel 
von A. M. Jasıom (zum Kapitel X) hinweisen.!) Für den Leser, der stärkeres 
Interesse für angewandte Aufgaben hat und sich z. B. für Probleme der Massen- 
bedienung interessiert, möchte ich das kürzlich in russischer Sprache erschie- 
nene Buch von A. J. CHINTScHIN „Mathematische Methoden der Theorie der 
Massenbedienung“ (Trudy Math. Inst. Stekloff Nr. 49, 1955) auf das wärmste 
empfehlen. Die Literatur über die mathematische Statistik ist in den letzten 
Jahren ungeheuer angewachsen. Eine recht eingehende Vorstellung über viele 
allgemeine Ideen dieser Wissenschaft vermittelt das Buch von H. CRAMER!). 
Von den Büchern, die einen stärker angewandten Charakter haben, möchte 
ich die Werke von A. Harp, Statistical Theory with engineering applications 
(New York-London 1952); I. W: Dunm-BArkowskı und N. W. SMIRNOW, 
Wahrscheinlichkeitsrechnung und mathematische Statistik m der Technik 
(Staatsve.lag für technisch-theoretische Literatur, Moskau 1955), E. WEBER, 
Grundriß der biologischen Statistik (Jena 1956) nennen. Besonders hinweisen 
möchte ich noch auf das Buch von L. SCHMETTERER, Einführung in die mathe- 
matische Statistik, Springer-Verlag, Wien 19562), das ich für eines der gegenwär- 
tig besten Bücher zur mathematischen Statistik in deutscher Sprache halte. 
Wichtig ist, daß hier der Versuch unternommen wird, eine deutsche Standard- 
Terminologie für die Statistik zu schaffen. 

Der kurze historische Abriß am Ende meines Lehrbuches erhebt keinen An- 
spruch auf Vollständigkeit. Er gibt eine Vorstellung über die Entwicklung der 
Wahrscheinlichkeitsrechnung in Europa bis zur Mitte des XIX. Jahrhunderts. 
Eine ausführliche Übersicht über die moderne Entwicklung der Wahrschein- 
lichkeitsrechnung ist bis jetzt noch nicht geschrieben worden. Der Verfasser 
hofft, in den folgenden russischen Auflagen des Buches diese Lücke schließen 
zu können. 

Ich würde mich sehr freuen, wenn die Herausgabe der vorliegenden deutschen 
Übersetzung des Lehrbuches dazu beitrüge, das Interesse des deutschen mathe- 
matischen Nachwuchses für das Gebiet der Wahrscheinlichkeitsrechnung und 
der mathematischen Statistik zu verstärken. 


Kiew, im Mai 1957 B. GNEDENKO 


1) siehe Literaturverzeichnis (Anm. d. Red.). 


2) und B.L. van DER WAERDEN, Mathematische Statistik, Springer-Verlag, Berlin/ 
Göttingen/Heidelberg 1957. 
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EINLEITUNG 


Das Ziel dieses Buches ist die Darlegung der Grundlagen der Wahrscheın- 
lichkeitsrechnung, der mathematischen Disziplin, welche die Gesetzmäßig- 
keiten bei zufälligen Erscheinungen erforscht. 

Die Wahrscheinlichkeitsrechnung entstand um die Mitte des 17. Jahrhun- 
derts und ist mit den Namen HUyGens, PAscoAL, FERMAT und JACOB BERNOULLI 
verknüpft. In dem Briefwechsel zwischen PascAL und FERMAT, der durch Auf- 
gaben hervorgerufen wurde, die mit Glücksspielen zusammenhingen und nicht 
in den Rahmen der Mathematik jener Zeit paßten, kristallisierten sich all- 
mählich so wichtige Begriffe wie Wahrscheinlichkeit und mathematische Er- 
wartung heraus. Man muß sich klar darüber sein, daß die hervorragenden 
Gelehrten, die sich mit Aufgaben des Glücksspiels befaßten, auch die wichtige 
Rolle der Wissenschaft voraussahen, welche die zufälligen Erscheinungen unter- 
sucht. Sie waren überzeugt, daß sich bei massenhaften zufälligen Ereignissen 
klare Gesetzmäßigkeiten herausbilden. Jedoch infolge des niedrigen Ent- 
wicklungsstandes der Naturwissenschaft jener Zeit bildeten die Glücksspiele 
und auch die Fragen von Demographie und Versicherung noch für lange Zeit 
den einzigen konkreten Gegenstand, anhand dessen man die Begriffe und Me- 
thoden der Wahrscheinlichkeitsrechnung entwickeln konnte. Dieser Umstand 
bestimmte auch den formalen mathematischen Apparat, mit Hilfe dessen sie 
die in der Wahrscheinlichkeitsrechnung entstehenden Aufgaben lösten: Es 
wurden ausschließlich elementare arithmetische und kombinatorische Methoden 
verwendet. Die nachfolgende Entwicklung der Wahrscheinlichkeitsrechnung 
sowie die weitgehende Heranziehung ihrer Methoden und Resultate bei natur- 
wissenschaftlichen, insbesondere physikalischen Forschungen zeigten, daß die 
klassischen Begriffe und Methoden auch in der Gegenwart nicht an Interesse 
verloren haben. 

Bedeutende Anforderungen, welche die Naturwissenschaft (Theorie der Be- 
obachtungsfehler, Aufgaben der Lehre vom Schuß, Probleme der Statistik, 
in erster Linie der Bevölkerungsstatistik) stellte, führten zu der Notwendig- 
keit einer Weiterentwicklung der Wahrscheinliehkeitsrechnung und der Heran- 
ziehung eines komplizierten analytischen Apparates. Eine besonders bedeutende 
Rolle bei der Entwicklung der analytischen Methoden der Wahrscheinlichkeits- 
rechnung spielten MoIVRE, LAPLACE, Gauss und Poıssox. In formal-analytischer 
Beziehung schließt sich dieser Richtung auch die Arbeit des Schöpfers der 
nichteuklidischen Geometrie, N. I. LOBATSCHEWSKIS, an, die der Theorie der 
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Fehler bei Messungen auf einer Kugel gewidmet war und sich das Ziel setzte, 
das geometrische System aufzustellen, welches dem Weltall zugrunde liegt. 

Von der Mitte des 19. Jahrhunderts bis fast in die zwanziger Jahre unseres 
Jahrhunderts ist die Entwicklung der Wahrscheinlichkeitsrechnung in bedeuten- 
dem Maße mit den Namen russischer Gelehrter — P. L. TscHEBYScHEws, 
A. A. Markows, A. M. Lsarunows — verknüpft. Dieser Erfolg der russischen 
Wissenschaft wurde durch die Tätigkeit W. J. Bunsakowskıs vorbereitet, der 
die Untersuchungen über die Anwendung der Wahrscheinlichkeitsrechnung auf 
die Statistik, insbesondere auf Versicherungsprobleme und die Bevölkerungs- 
statistik in Rußland, weitgehend förderte. Von ihm stammt das erste russische 
Lehrbuch der Wahrscheinlichkeitsrechnung, das einen großen Einfluß auf 
die Entwicklung des Interesses an dieser Wissenschaft in Rußland ausübte. 
Die grundlegende, unvergängliche Bedeutung der Arbeiten TschegyscHhEws, 
MArKows und LJArunows auf dem Gebiet der Wahrscheinlichkeitsrechnung 
besteht darin, daß von ihnen der Begriff der zufälligen Größe eingeführt und 
ausgiebig verwendet wurde. Mit den Resultaten TSCHEBYSCHEWS über das 
Gesetz der großen Zahl, mit den „MarkKowschen Ketten‘ und mit dem Grenz- 
wertsatz von LJAPUNow befassen wir uns in den entsprechenden Abschnitten 
dieses Buches. 

Die moderne Entwicklung der Wahrscheinlichkeitsrechnung ist dadurch 
charakterisiert, daß das Interesse an ihr allgemein gewachsen und der Kreis 
ihrer praktischen Anwendungen ausgedehnt worden ist. In den USA, in Frank- 
reich, Schweden, Ungarn, Japan, Deutschland, Polen und anderen Ländern 
gibt es zahlreiche Gelehrte, die wichtige Resultate zur Wahrscheinlichkeits- 
rechnung beitragen. Bei dieser intensiven wissenschaftlichen Arbeit nimmt 
die sowjetische Schule der Wahrscheinlichkeitsrechnung weiterhin einen her- 
vorragenden Platz ein. 

Unter den sowjetischen Gelehrten müssen vor allem S. N. BERNSTEIN, 
A.N.Kormocororr und A. J. CHINTSCHIN!) genannt werden. Im Laufe unserer 
Darlegungen werden wir durch das Wesen der Sache selbst gezwungen sein, 
den Leser mit den Ideen und Resultaten der Gelehrten unserer Zeit bekannt 
zu machen, die einen umwälzenden Einfluß auf die Wahrscheinlichkeitsrechnung 
gehabt haben. So werden wir schon im ersten Kapitel über die fundamentalen 
Arbeiten S. N. BEernsrtems und A. N. KoLmoGoror#rs über die Grundlegung der 
Wahrscheinlichkeitsrechnung reden. Im ersten Jahrzehnt unseres Jahrhunderts 
kam E. BoREL auf die Idee, die Wahrscheinlichkeitsrechnung mit der metrischen 
Theorie der reellen Funktionen zu verknüpfen. In den zwanziger Jahren ent- 
wickelten A. J. CHintschm, A. N. KoLMoGoRoFF, E. E. SLurzeı, P. Läfvy, 
A. Lomnıck1 diese Idee, die sich als überaus befruchtend für die Entwicklung 
dieser Wissenschaft erwies. Insbesondere gelang es gerade auf diesem Wege, 
abschließende Lösungen für klassische Aufgaben zu finden, die schon von P.L. 
TSCHEBYSCHEW gestellt worden waren. Wesentliche Erfolge in dieser Richtung 


?) Dieser Name wird häufig auch mit Kurstcame oder ähnlich transkribiert (Anm. der 
Red.). 
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sind mit den Namen LINDEBERG, S. N. BERNSTEIN, A. N. KoLMOGoROFF, A. J. 
CHINTSCHIn, P. L£fvy, W. FELLER und einigen anderen verknüpft. Die metri- 
sche Funktionentheorie, später aber auch die Funktionalanalysis, gestatteten 
eine wesentliche Erweiterung des Inhalts der Wahrscheinlichkeitsrechnung. 
In den dreißiger Jahren wurden die Grundlagen für die Theorie der stochasti- 
schen (zufälligen) Prozesse geschaffen, die jetzt eine der Hauptforschungs- 
richtungen in der Wahrscheinlichkeitsrechnung ist. Diese Theorie dient in 
hervorragender Weise der organischen Synthese mathematischen und natur- 
wissenschaftlichen Denkens, denn es sind hier zwei Aufgaben miteinander ver- 
knüpft: Es ist einmal das physikalische Wesen gewisser Kernprobleme der Natur- 
wissenschaften inhaltlich zu erfassen, und sodann eine adäquate mathematische 
Sprache für die Theorie zu finden. 

Eine Idee zur Schaffung einer ähnlichen Theorie hat anscheinend schon 
A. PorncAr& geäußert und ein erster Ansatz zu ihrer Verwirklichung findet sich 
bei BACHELIER, FOKKER, PLANCK; jedoch ist die streng mathematische Grund- 
legung der Theorie der stochastischen Prozesse mit den Namen A. N. KoLmo- 
GOROFF und A. J. CHINTSCHIN verbunden. 

Es ist wichtig festzustellen, daß sich die Lösung klassischer Aufgaben der 
Wahrscheinlichkeitsrechnung als eng zusammenhängend mit der Theorie der 
stochastischen Prozesse erwies. Die Elemente dieses wichtigen neuen Teil- 
gebiets der Wahrscheinlichkeitsrechnung werden wir im zehnten Kapitel 
darlegen. Wir erwähnen schließlich ein neues Gebiet der mathematischen 
Statistik, das die Bezeichnung „nichtparametrische Probleme der Statistik‘ 
erhielt. Eine gewisse Vorstellung über den Inhalt dieses Wissenschaftsgebiets 
geben die Paragraphen 61—63. 

In den letzten zehn Jahren ist die Bedeutung unermeßlich gewachsen, welche 
die Wahrscheinlichkeitsrechnung in der modernen Naturwissenschaft besitzt. 
Seit die Molekularvorstellungen vom Aufbau der Materie allgemeine Anerken- 
nung erhielten, begann unausweichlich eine weitgehende Anwendung der Wahr- 
scheinlichkeitsrechnung auch in Physik und Chemie. Vom Standpunkt der 
Molekularphysik besteht jedes Ding aus einer ungeheuren Anzahl kleiner 
Teilchen, die sich dauernd in Bewegung befinden und dabei aufeinander ein- 
wirken. Dabei ist über die Natur dieser Teilchen, über die zwischen ihnen 
bestehende Wechselwirkung, die Art ihrer Bewegung usw. wenig bekannt. 
Im wesentlichen erschöpfen sich unsere Kenntnisse darin, daß die Anzahl 
der Teilchen, aus denen ein Körper besteht, sehr groß ist und daß sie sich 
bei einem homogenen Körper in ihren Eigenschaften wenig unterscheiden. 
Natürlich sind unter solchen Bedingungen die sonst in physikalischen Theorien 
üblichen mathematischen Forschungsmethoden völlig nutzlos. So können z.B. 
unter den erwähnten Umständen Differentialgleichungen keine wesentlichen 
Resultate liefern. In der Tat sind ja weder die Struktur, noch die Gesetze der 
gegenseitigen Wechselwirkung der Teilchen in ausreichendem Maße bekannt, 
und unter solchen Umständen muß die Anwendung der Theorie der Diffe- 
rentialgleichungen Elemente grober Willkür an sich tragen. Aber sogar wenn 
2 Gnedenko 
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man von dieser Schwierigkeit absieht, ergeben sich, wenn man die Bewegung 
einer großen Menge solcher Teilchen studieren will, so große Schwierigkeiten, 
daß man sie mit den üblichen Gleichungen der Mechanik nicht überwinden kann. 

Es kommt hinzu, daß ein solches Herangehen auch methodologisch unbe- 
friedigend ist. In der Tat besteht die Aufgabe, welche hier vorliegt, nicht 
darin, die individuelle Bewegung der Teilchen zu studieren, sondern die Ge- 
setzmäßigkeiten herauszufinden, die sich in einer Gesamtheit von einer großen 
Anzahl von Teilchen ergeben, die sich bewegen und miteinander in Wechsel- 
wirkung stehen. Diese Gesetzmäßigkeiten, welche sich dadurch ergeben, daß 
die zu ihrer Entstehung beitragenden Bestandteile in großen Massen auf- 
treten, haben ihren eigenen Charakter und können nicht durch eine einfache 
Summierüng der individuellen Bewegungen erhalten werden. Außerdem er- 
weisen sich diese Gesetzmäßigkeiten innerhalb gewisser Grenzen als unabhängig 
von den individuellen Besonderheiten der Teilchen, um die es sich jeweils 
handelt. Natürlich müssen zum Studium dieser neuen Gesetzmäßigkeiten 
auch entsprechende neue mathematische Forschungsmethoden gefunden 
werden. 

Welche Forderungen müssen in erster Linie an diese Methoden gestellt 
werden? Es ist klar, daß sie in erster Linie berücksichtigen müssen, daß 
die betrachteten Erscheinungen Massencharakter haben. Daher darf für 
diese Methoden das Vorhandensein einer großen Anzahl aufeinander ein- 
wirkender Teilchen keine zusätzliche Erschwerung sein, sondern es muß das 
Studium der Gesetzmäßigkeiten erleichtern. Ferner darf die Unzulänglichkeit 
unserer Kenntnisse über die Natur und den Aufbau der Teilchen ihre Wirk- 
samkeit nicht beschränken. Diesen Bedingungen genügen vor allem die Me- 
thoden der Wahrscheinlichkeitsrechnung. 

Damit das Gesagte nicht falsch verstanden wird, betonen wir noch einmal 
folgenden Umstand. Wenn wir sagen, daß der Apparat der Wahrscheinlich- 
keitsrechnung dem Studium der Molekularerscheinungen am besten angepaßt 
ist, so wollen wir damit nicht etwa behaupten, daß die philosophischen Voraus- 
setzungen für die Anwendbarkeit der Wahrscheinlichkeitsrechnung in unserer 
„ungenügenden Kenntnis“ liegen. Das Grundprinzip besteht darin, daß die 
Massenerscheinungen eigentümliche neue Gesetzmäßigkeiten erzeugen. Beim 
Studium von Erscheinungen, die durch eine große Anzahl von Molekülen be- 
dingt sind, ist die Kenntnis der Eigenschaften jedes Moleküls nicht notwen- 
dig. In der Tat muß man beim Studium der Naturerscheinungen vom Ein- 
fluß unwesentlicher Einzelheiten absehen. Eine Betrachtung aller Details und 
aller Zusammenhänge, die für die betrachtete Erscheinung gar nicht alle 
wesentlich sind, führt nur dazu, daß die Erscheinung selbst verdunkelt wird 
und die Beherrschung infolge der künstlich erschwerten Verhältnisse schwie- 
riger wird. 

Wie gut die Schematisierung einer Erscheinung vollzogen, wie günstig der 
mathematische Apparat zu ihrer Untersuchung gewählt worden ist, das können 
wir durch Vergleich der Theorie mit der Erfahrung, mit der Praxis beurteilen. 


Einleitung 5 


Die Entwicklung der Naturwissenschaft, insbesondere der Physik, zeigt, daß 
der Apparat der Wahrscheinlichkeitsrechnung sich bei der Erforschung zahl- 
reicher Naturerscheinungen als sehr geeignet erwiesen hat. 

Der erwähnte Zusammenhang zwischen der Wahrscheinlichkeitsrechnung 
und den Bedürfnissen der modernen Physik erklärt am besten die Tatsache, 
daß die Wahrscheinlichkeitsrechnung in den letzten Jahrzehnten zu einem 
derjenigen Gebiete der Mathematik geworden ist, die sich am schnellsten ent- 
wickeln. Neue theoretische Resultate eröffneten neue Möglichkeiten für die 
Naturwissenschaft, die Methoden der Wahrscheinlichkeitsrechnung zu benutzen. 
Das allseitige Studium der Naturerscheinungen führt die Wahrscheinlichkeits- 
rechnung zur Entdeckung neuer Gesetzmäßigkeiten, die vom Zufall erzeugt 
werden. Die Wahrscheinlichkeitsrechnung sondert sich nicht von den Inter- 
essen anderer Wissenschaften ab, sondern hält Schritt mit der allgemeinen 
Entwicklung der Naturwissenschaft. Dies bedeutet natürlich nicht, daß die 
Wahrscheinlichkeitsrechnung nur Hilfsmittel für die Lösung praktischer Auf- 
gaben ist. Die Wahrscheinlichkeitsrechnung ist in den letzten drei Jahrzehnten 
zu einer strengen mathematischen Disziplin mit eigenen Problemen und Be- 
weismethoden geworden. Dabei erwies es sich zugleich, daß die wichtigsten 
Probleme der Wahrscheinlichkeitsrechnung im Zusammenhang mit der Lösung 
verschiedener Aufgaben der Naturwissenschaft stehen. 

Wir definierten eingangs die Wahrscheinlichkeitsrechnung als Wissenschaft, 
welche die zufälligen Erscheinungen studiert. Wir verschieben die Klärung des 
Begriffs „zufällige Erscheinung (zufälliges Ereignis)‘ auf das erste Kapitel und 
beschränken uns hier auf einige Bemerkungen. Im Sinne der landläufigen 
Vorstellungen und der alltäglichen Praxis ist ein zufälliges Ereignis etwas sehr 
Seltenes, das der gewohnten Ordnung der Dinge, der gesetzmäßigen Ent- 
wicklung der Ereignisse zuwiderläuft. In der Wahrscheinlichkeitsrechnung 
gehen wir von diesen Vorstellungen ab. Die zufälligen Ereignisse, wie sie in 
der Wahrscheinlichkeitsrechnung betrachtet werden, haben eine Reihe cha- 
rakteristischer Eigenschaften, insbesondere treten sie bei Massenerscheinungen 
auf. Unter Massenerscheinungen verstehen wir solche Vorgänge, die in Ge- 
samtheiten stattfinden, die aus einer großen Anzahl von gleichberechtigten 
oder "fast gleichberechtigten Objekten bestehen, und die gerade durch den 
Massencharakter der Erscheinung bestimmt werden und nur in unbedeutendem 
Maße von der Natur der einzelnen Objekte abhängen, aus denen sich die Ge- 
samtheit zusammensetzt. Die Wahrscheinlichkeitsrechnusg entwickelt sich 
wie andere Teile der Mathematik aus den Bedürfnissen der Praxis heraus. Sie 
gibt in abstrakter Form die Gesetzmäßigkeiten an, die bei zufälligen Erschei- 
nungen von Massencharakter auftreten. Diese Gesetzmäßigkeiten spielen eine 
unerhört wichtige Rolle in der Physik und in anderen Gebieten der Natur- 
wissenschaft, im Kriegswesen, auf mannigfaltigen technischen Gebieten, in der 
Wirtschaftslehre usw. In letzter Zeit werden im Zusammenhang mit der breiten 
Entwicklung von Betrieben, welche Massenartikel produzieren, Ergebnisse der 
Wahrscheinlichkeitsrechnung nicht nur bei der Prüfung schon fertiger Produkte, 
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sondern, was viel wichtiger ist, zur Organisation des Produktionsprozesses 
selbst ausgenutzt (statistische Produktionskontrolle). 

Der Zusammenhang der Wahrscheinlichkeitsrechnung mit praktischen Be- 
dürfnissen war, wie wir schon erwähnten, eine Hauptursache für ihre schnelle 
Entwicklung in den letzten drei Jahrzehnten. Viele ihrer Teilgebiete wurden 
gerade im Zusammenhang mit Bedürfnissen der Praxis entwickelt. Wir wollen 
hier an das bemerkenswerte Wort des Begründers unserer vaterländischen 
wahrscheinlichkeitstheoretischen Schule, P. L. TSCHEBYSCHEWws, erinnern: „Die 
Annäherung von Wissenschaft und Praxis gibt die fruchtbarsten Resultate, 
und es ist nicht nur die Praxis, die daraus Vorteil zieht; die Wissenschaft 
selbst entwickelt sich unter dem Einfluß der Praxis, denn diese eröffnet neue 
Probleme für die Forschung oder neue Seiten an längst bekannten Gegen- 
ständen... Wenn die Theorie viel gewinnt von neuen Anwendungen alter 
Methoden oder ihrer Weiterentwicklung, so zieht sie doch noch viel größeren 
Nutzen aus der Erschließung neuer Methoden, und in diesem Fall ist die Wissen- 
schaft der wahrhafte Führer in der Praxis.‘ 


DER BEGRIFFDER WAHRSCHEINLICHKEIT 


$ 1. Sichere, unmögliche und zufällige Ereignisse 


Die Wissenschaft gelangt auf Grund von Beobachtungen und Experimenten 
zur Formulierung von Gesetzmäßigkeiten, denen der Verlauf der von ihr unter- 
suchten Erscheinungen unterworfen ist. Das einfachste und geläufigste Schema, 
solche Gesetzmäßigkeiten zu formulieren, ist das folgende: 


1. Jedesmal, wenn alle in einem Komplex © zusammengefaßten Bedingungen 
erfüllt sind, tritt das Ereignis A ein. 

Wird z.B. Wasser bei einem Druck von 760 mm auf 100° C- erhitzt (dies 
ist der Komplex ©), so geht es in Dampf über (dies ist das Ereignis A). Oder 
ein anderes Beispiel: Wenn bei einer chemischen Reaktion irgendwelcher Stoffe 
kein Austausch mit dem umgebenden Mittel stattfindet (dies sind die Bedin- 
gungen aus ©), so bleibt die Gesamtmasse der Stoffe unverändert (dies ist 
das Ereignis A). Letztere Aussage ist das Gesetz von der Erhaltung der Ma- 
terie. Der Leser kann leicht andere Beispiele ähnlicher Gesetzmäßigkeiten 
aus der Physik, der Chemie, der Biologie und aus anderen Wissenschaften an- 
führen. 

Ein Ereignis, das bei jeder Realisierung des Komplexes © eintritt, heißt ein 
sicheres Ereignis. Wenn ein Ereignis A bei Verwirklichung aller Bedingungen 
von © auf keinen Fall eintreten kann, so nennt man es ein unmögliches Er- 
eignis. 

Unter 1. wird die Sicherheit eines Ereignisses A bei Verwirklichung aller 
Bedingungen aus © ausgesagt. Die Behauptung der Unmöglichkeit irgend- 
eines Ereignisses, wenn alle Bedingungen des Komplexes © erfüllt sind, stellt 
nichts wesentlich Neues dar. Diese läßt sich nämlich leicht auf eine Aussage 
vom Typus 1. zurückführen: Die Unmöglichkeit eines Ereignisses A ist gleich- 
wertig mit der Sicherheit des entgegengesetzten Ereignisses A. Dieses besteht 
darin, daß das Ereignis A nicht eintritt. 

Aber lange nicht alle realen Erscheinungen ereignen sich nach diesem Schema. 
Möge z B. das Ereignis A in dem einmaligen Reißen des Fadens an einer 
Spindel während einer Zeitspanne von 10Min. bestehen (Komplex ©: ge- 
gebene Spindel, gegebenes Material, gegebene Qualität und gegebenes Zeit- 
intervall). Bekanntlich kann das Ereignis unter diesen Bedingungen eintreten, 
es braucht aber nicht einzutreten. 

Wir kommen so zu der Notwendigkeit, Gesetzmäßigkeiten einer anderen 
Art zu betrachten, nämlich solche, die bei einem gegebenen Bedingungskomplex 
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eintreten können, aber nicht notwendig einzutreten brauchen. Solche Er- 
eignisse nennt man zufällige Ereignisse. Bei Änderung des Bedingungskom- 
plexes kann ein zufälliges Ereignis in ein sicheres oder auch in ein unmögliches 
übergehen und umgekehrt. Die Eigenschaft eines Ereignisses sicher, zufällig 
oder unmöglich zu sein, hängt also stets von einer bestimmten Gesamtheit © 
von Bedingungen ab. 


Mit der Aussage allein, daß ein Ereignis zufällig ist, kann man nicht viel 
anfangen. Sie gibt nur einen Hinweis darauf, daß der Komplex © von Be- 
dingungen nicht die Gesamtheit aller Ursachen widerspiegelt, die zum Ein- 
treten eines Ereignisses A notwendig und hinreichend sind. Einen solchen 
Hinweis braucht man nicht als vollständig nutzlos anzusehen, denn er kann 
Anlaß zu einer weiteren Erforschung der Bedingungen geben, unter denen das 
Ereignis A auftritt. Nur liefert er selbst noch keine positiven Erkenntnisse. 

Für eine Vielzahl von Erscheinungen tritt nun der folgende Sachverhalt 
ein: Der Komplex & von Bedingungen sei mehrfach erfüllt. Jede Realisierung 
des Komplexes © wollen wir einen Versuch nennen. Es mögen n Versuche 
ausgeführt werden. Die Anzahl der Versuche, bei denen das Ereignis A ein- 


tritt, sei gleich m. Es zeigt sich, daß in vielen Fällen der Quotient — für 


große n nahezu konstant ist und sein Wert in der Nähe einer Zahl p bleibt. 
Diese Zahl kann zu einer quantitativen Charakterisierung der Wahrscheinlich- 
keit des Ereignisses A (bei gegebenem Komplex ©) dienen. 


In solchen Fällen läßt sich außer der einfachen Feststellung der Zufälligkeit 
des Ereignisses A auch eine quantitative Abschätzung der Möglichkeit seines 
Auftretens angeben. Diese Abschätzung findet in Sätzen wie etwa dem fol- 
genden ihren Ausdruck: 


2. Die Wahrscheinlichkeit dafür, daß bei Realisierung aller Bedingungen aus 
© das Ereignis A eintritt, ist gleich p. 


Ereignisse dieser zweiten Art heißen wahrscheinliche oder stochastische Ereig- 
nisse. Die stochastischen Ereignisse spielen auf den verschiedensten Gebieten 
der Wissenschaft eine große Rolle. So gibt es z.B. kein Verfahren, voraus- 
zusagen, ob ein vorgegebenes Radiumatom innerhalb eines gegebenen Zeit- 
intervalles zerfällt oder nicht zerfällt. Man kann jedoch auf Grund der Erfahrung 
eine Wahrscheinlichkeit des Zerfalls angeben: Ein Radiumatom zerfällt im 
Verlaufe von £ Jahren mit der Wahrscheinlichkeit 


p= 1— er" Woset 


Der Komplex © besteht in diesem Beispiel darin, daß man ein Radium- 
atom betrachtet, das im Verlaufe einer gewissen Anzahl von Jahren keinen 
außergewöhnlichen Operationen, wie etwa einer Beschießung durch schnelle 
Teilchen, unterworfen wird. Die übrigen Existenzbedingungen sind dabei ganz 
unwesentlich: Es ist z. B. unwichtig, in welches Medium es eingebettet ist und 
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welche Temperatur dabei herrscht. Das Ereignis A besteht darin, daß das 
Atom im Verlaufe von £ Jahren zerfällt. 

Die uns jetzt ganz natürlich erscheinende Idee, daß sich die Wahrscheinlich- 
keit eines zufälligen Ereignisses A bei bekannten Bedingungen quantitativ mit 
Hilfe einer gewissen Zahl 

p = P(A) 


abschätzen läßt, erfuhr eine systematische Entwicklung zuerst im 17. Jh. durch 
die Arbeiten von Fermar (1601—1665), PascaL (1623—1662), HuvaEns 
(1629-1695) und besonders J. Berwouruı (1654—1705). Ihre Untersuchungen 
legten den Grundstein für die Wahrscheinlichkeitsrechnung. Als mathematische 
Disziplin hat sich die Wahrscheinlichkeitsrechnung seit dieser Zeit stetig ent- 
wickelt und dabei neue wichtige Resultate hervorgebracht. Auch ihre An- 
wendbarkeit auf die Untersuchungen realer Erscheinungen der verschiedensten 
Art findet sich ständig von Neuem glänzend bestätigt. 


Zweifellos verdient der Begriff der mathematischen Wahrscheinlichkeit eine 
eingehendere philosophische Untersuchung. Das spezifisch philosophische 
Problem, daß einmal durch die Existenz der Wahrscheinlichkeitsrechnung an 
sich und ferner durch ihre erfolgreiche Anwendung auf Erscheinungen der 
Umwelt entstand, besteht in folgendem: Unter welchen Bedingungen 
hat die quantitative Abschätzung der Wahrscheinlichkeit eines 
zufälligen Ereignisses A mit Hilfe einer bestimmten Zahl P (A)— 
genannt die mathematische Wahrscheinlichkeit des Ereignisses A — eine 
objektive Bedeutung und welche objektive Bedeutung besitzt 
diese Abschätzung? Eine klare Vorstellung von den Beziehungen zwischen 
den beiden philosophischen Kategorien des Zufälligen und des Notwendigen 
ist eine unbedingte Vorraussetzung für eine erfolgreiche Analyse des Begriffes 
der mathematischen Wahrscheinlichkeit. Diese Analyse kann jedoch nicht voll- 
ständig sein ohne eine Antwort auf die von uns gestellte Frage, unter welchen 
Bedingungen die Zufälligkeit eine quantitative Abschätzung in Form einer 
Zahl — der Wahrscheinlichkeit — gestattet. 


Jeder Forscher, der sich mit den Anwendungen der Wahrscheinlichkeits- 
rechnung auf die Physik, die Biologie, die Ballistik, die ökonomische Statistik 
oder eine beliebige andere konkrete Wissenschaft beschäftigt, geht bei seiner 
Arbeit im wesentlichen von der Überzeugung aus, daß die stochastischen Aus- 
sagen gewisse objektive Eigenschaften der untersuchten Erscheinungen ausdrücken. 
Die Behauptung, daß für irgendeinen Komplex © von Bedingungen das Auf- 
treten eines Ereignisses A die Wahrscheinlichkeit p besitzt, ist gleichwertig mit 
der Behauptung, daß zwischen dem Komplex © und dem Ereignis A ein eigen- 
tümlicher, aber wohlbestimmter und nichtsdestoweniger objektiver, von dem 
beobachtenden Subjekt vollkommen unabhängiger Zusammenhang besteht. 
Die philosophische Aufgabe besteht gerade in der Aufdeckung der Natur dieses 
Zusammenhanges. Die Schwierigkeit dieser Aufgabe ist auch die Ursache für 
die paradoxe Erscheinung, daß man selbst unter Gelehrten, die in allgemeinen 
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Fragen der Philosophie nicht auf einen idealistischen Standpunkt stehen, 
anstelle einer positiven Lösung des Problems das Bestreben beobachten kann, 
den Sachverhalt so zu deuten, als hätten die stochastischen Aussagen nur eine 
Beziehung zu dem Zustand des erkennenden Subjekts (indem sie ein Maß für 
den Grad seiner Überzeugtheit vom Auftreten des Ereignisses A darstellen 
usw.). 


Die vielfältigen Erfahrungen bei der Anwendung der Wahrscheinlichkeits- 
rechnung auf den verschiedensten Gebieten lehren, daß gerade die Aufgabe 
der quantitativen Abschätzung der Wahrscheinlichkeit irgendeines Ereignisses 
nur unter gewissen ganz bestimmten Bedingungen einen objektiven Sinn hat. 

Die oben gegebene Definition der Zufälligkeit eines Ereignisses A bezüglich 
eines Komplexes © von Bedingungen trägt rein negativen Charakter: Ein Er- 
eignis ist zufällig, wenn es nicht notwendig und nicht unmöglich ist. Aus der 
Zufälligkeit eines Ereignisses in diesem rein negativen Sinne folgt noch lange 
nicht, daß es sinnvoll ist, von seiner Wahrscheinlichkeit als von einer ganz 
bestimmten, wenn uns vielleicht auch unbekannten Zahl zu sprechen. Anders 
ausgedrückt stellt nicht nur die Aussage — ‚das Ereignis A besitzt bezüglich 
des Komplexes © von Bedingungen die bestimmte Wahrscheinlichkeit P(A)“ 
— sondern auch die einfachere Aussage, daß diese Wahrscheinlichkeit existiert, 
eine Behauptung dar, die in jedem einzelnen Falle begründet werden muß, 
oder, wenn sie als Hypothese angenommen wird, einer nachfolgenden Be- 
stätigung bedarf. 

Trifft z.B. ein Physiker auf ein neues radioaktives Element, so wird er von 
vornherein voraussetzen, daß für ein Atom dieses Elements, das sich selbst 
überlassen ist (d.h. nicht äußeren Einwirkungen von überaus großer Inten- 
sität ausgesetzt ist), eine gewisse Wahrscheinlichkeit für den Zerfall während 
eines Zeitintervalles Z existiert, deren Abhängigkeit von der Zeit durch die 
Formel 

p= , DE et, 


beschrieben wird. Er wird sich dann die Aufgabe stellen, den Koeffizienten « 
zu bestimmen, der die Zerfallsgeschwindigkeit des neuen radioaktiven Elements 
charakerisiert. Es kann z. B. die Frage gestellt werden, wie die Wahrschein- 
lichkeit des Zerfalls von äußeren Bedingungen, etwa von der Intensität der 
kosmischen Strahlung, abhängt. Hierbei muß der Forscher von der Annahme 
ausgehen, daß jeder hinreichend bestimmten Gesamtheit von äußeren Be- 
dingungen ein ganz bestimmter Wert des Koeffizienten « zukommt. 

Ebenso steht es auch in allen anderen Fällen, in denen sich die Wahrschein- 
lichkeitsrechnung bei der Anwendung auf praktische Aufgaben bewährt hat. 
Die Aufgabe, den realen Inhalt des Begriffes der „mathematischen Wahr- 
scheinlichkeit‘‘ von philosophischer Seite aufzuklären, kann man daher von 
vornherein als hoffnungslos ansehen, wenn man Definitionen fordert, die auf 
ein beliebiges Ereignis A bei einem beliebigen N von Bedingungen © 
anwendbar sind. 
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Die Anzahl der verschiedenen von dem einen oder anderen Autor vorge- 
schlagenen Definitionen der mathematischen Wahrscheinlichkeit ist sehr groß. 
Wir wollen aber jetzt nicht diese zahlreichen Definitionen mit allen ihren 
logischen Feinheiten darlegen. Jede wissenschaftliche Definition eines solchen 
grundlegenden Begriffes wie des Begriffes der Wahrscheinlichkeit ist lediglich 
eine verfeinerte logische Bearbeitung einer Reihe sehr einfacher Beobachtungen 
und zweckmäßiger Verfahren, die sich durch lange und erfolgreiche Anwendung 
in der Praxis bewährt haben. Das Interesse an einer logisch einwandfreien 
„Begründung‘ der Wahrscheinlichkeitstheorie entstand historisch später, als 
man schon längst die Wahrscheinlichkeit verschiedener Ereignisse bestimmt 
hatte, mit diesen Wahrscheinlichkeiten gerechnet hatte und auch die Re- 
sultate der durchgeführten Rechnungen in der Praxis und bei wissenschaft- 
lichen Untersuchungen benutzt hatte. Bei den meisten Versuchen, den all- 
gemeinen Begriff der Wahrscheinlichkeit wissenschaftlich zu definieren, kann 
man daher leicht die verschiedenen Seiten des konkreten Erkenntnisprozesses 
studieren, der in jedem einzelnen Falle zur tatsächlichen Bestimmung der 
Wahrscheinlichkeit des einen oder anderen Ereignisses führt, sei es der Wahr- 
scheinlichkeit für das Auftreten einer 6 bei vier Würfen eines Würfels oder 
der Wahrscheinlichkeit des radioaktiven Zerfalls oder der Wahrscheinlichkeit, 
ein Ziel zu treffen. Einige Definitionen gehen von völlig unwesentlichen Eigen- 
schaften der realen Prozesse aus — derartige Definitionen sind gänzlich un- 
fruchtbar. Andere berücksichtigen nur spezielle Gesichtspunkte oder benutzen 
irgendwelche Verfahren für die praktische Ermittlung der Wahrscheinlichkeit, 
die nicht in allen Fällen anwendbar sind — solche Definitionen müssen wir 
trotz ihrer Einseitigkeit eingehender betrachten. 


Von dem hier skizzierten Standpunkt aus läßt sich die Mehrzahl der Defi- 
nitionen der mathematischen Wahrscheinlichkeit in drei Gruppen einteilen: 


1. Definitionen der mathematischen Wahrscheinlichkeit als eines quanti- 
tativen Maßes für den „Überzeugtheitsgrad‘ des erkennenden Subjekts. 


2. Definitionen, die den Begriff der Wahrscheinlichkeit auf den Begriff der 
„Gleichmöglichkeit‘‘ als ursprünglicheren Begriff zurückführen (die sog. 
„klassische‘‘ Definition der Wahrscheinlichkeit). 


3. Definitionen, die von der „relativen Häufigkeit‘ des Auftretens eines 
Ereignisses in einer großen Anzahl von Versuchen ausgehen (die „slatistische‘‘ 
Definition der Wahrscheinlichkeit). Den Definitionen der zweiten und dritten 
Gruppe sind die $$ 4 und 7 gewidmet. 


Den Schluß dieses Paragraphen benutzen wir zu einer Kritik der Defini- 
tionen der ersten Gruppe. Wenn die mathematische Wahrscheinlichkeit ein 
quantitatives Maß für den Grad der Überzeugtheit des erkennenden Subjekts 
ist, so erscheint die Wahrscheinlichkeitsrechnung als ein Teilgebiet der Psycho- 
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logie. Im Enderfolg führt ein konsequentes Festhalten an einer solchen rein 
subjektivistischen Konzeption über die Wahrscheinlichkeit notwendig zum 
subjektiven Idealismus. Nimmt man nämlich an, daß die quantitative Ab- 
schätzung der Wahrscheinlichkeit nur vom Zustand des erkennenden Sub- 
jekts abhängt, so besitzt auch keine aus den wahrscheinlichkeitstheoretischen 
Aussagen (der Form 2) abgeleitete Aussage einen objektiven, vom erkennenden 
Subjekt unabhängigen Inhalt. Währenddessen zieht die Wissenschaft aus 
wahrscheinlichkeitstheoretischen Aussagen der Form 2 viele positive Folge- 
rungen, die sich in ihrer Bedeutung in nichts von Sätzen unterscheiden, die 
man ohne Anwendung der Wahrscheinlichkeitsrechnung erhält. Z. B. leitet 
die Physik alle „makroskopischen“ Eigenschaften der Gase aus Voraus- 
setzungen über die Wahrscheinlichkeit des Verhaltens der einzelnen Moleküle 
ab. Schreibt man diesen Aussagen eine objektive, vom erkennenden Subjekt 
unabhängige Bedeutung zu, so muß man auch in den wahrscheinlichkeits- 
theoretischen Hypothesen über den Verlauf der „mikroskopischen“ molekularen 
Prozesse, von denen man ausgeht, nolwendig etwas mehr schen, als lediglich 
die Konstatierung eines psychologischen Zustandes, der in uns beim Nach- 
denken über die Bewegung der Moleküle wachgerufen wird. 


Für den, der die Ansicht vertritt, daß die Außenwelt eine von uns unab- 
hängige Realität besitzt und prinzipiell erkennbar ist, und der außerdem 
berücksichtigt, daß die wahrscheinlichkeitstheoretischen Aussagen mit Erfolg 
zur Erforschung der äußeren Welt benutzt werden, muß die Haltlosigkeit einer 
rein subjektiven Definition der mathematischen Wahrscheinlichkeit absolut 
klar sein. Mit dem bisher Gesagten könnte man die Beurteilung der Defi- 
nitionen der ersten Gruppe abschließen, wenn sie nicht gerade die Grundlage 
zu dem ursprünglichen populären Sinn des Wortes Wahrscheinlichkeit bildeten. 
Es ist dorh in der Tat so, daß in der Umgangssprache die Ausdrücke „wahr- 
scheinlich“, „sehr wahrscheinlich“, ‚wenig wahrscheinlich“ usw. einfach eine 
Beziehung des Sprechenden zur Frage der Wahrheit oder Falschheit irgend- 
eines einzelnen Urteils ausdrücken. Man muß daher unbedingt einen Umstand 
hervorheben, den wir bis jetzt noch nicht besonders berücksichtigten. In $1 
richteten wir sehr schnell unsere Aufmerksaınkeit auf die stochastischen Gesetz- 
mäßigkeiten der Form 2, wobei wir sie den streng kausalen Gesetzmäßig- 
keiten der Form 1 gegenüberstellten. Dabei gingen wir in völliger Überein- 
stimmung nıit den erfolgreichen wissenschaftlichen Anwendungen des Begriffes 
der mathematischen Wahrscheinlichkeit vor, wichen jedoch von Anfang an 
etwas von dem üblichen „vorwissenschaftlichen‘‘ Sinne des Wortes „Wahr- 
scheinlichkeit‘“ ab: Während man bei den wissenschaftlichen Anwendungen 
der Wahrscheinlichkeitsrechnung in der Praxis stets unter „Wahrscheinlichkeit‘ 
die Wahrscheinlichkeit des Auftretens eines gewissen Ereignisses A versteht, 
wobei es wenigstens im Prinzip möglich sein soll, den Komplex © von Bedin- 
gungen unbeschränkt oft zu realisieren (nur in diesem Falle drückt die Gleichung 


p = P(A) 
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eine gewisse objektive Gesetzmäßigkeit aus), so spricht man im Umgang 
gewöhnlich von einer größeren oder kleineren Wahrscheinlichkeit irgendeines 
wohlbestimmten Urteils. Nehmen wir z.B. die folgenden Aussagen: 


a) Jede gerade natürliche Zahl, die größer als zwei ist, läßt sich als Summe 
zweier Primzahlen darstellen. 


b) Am 7. Mai 1969 fällt in Moskau Schnee. — Dazu kann man folgendes 
sagen: In bezug auf die Aussage a) weiß man z.Z. bei weitem noch nicht 
alles, viele halten sie jedoch für sehr wahrscheinlich; eine genaue Antwort 
auf die Aussage b) wird man sicher erst am 7. Mai 1969 erhalten. Da jedoch 
der Schnee in Moskau im Mai äußerst selten fällt, muß man z.Z. die Aus- 
sage b) für wenig wahrscheinlich halten. 


Ähnlichen Aussagen bezüglich der Wahrscheinlichkeit einzelner Tatbestände 
oder überhaupt irgendwelcher spezieller Urteile kann man in der Tat nur eine 
subjektive Bedeutung beilegen: Sie spiegeln lediglich eine Beziehung des 
Sprechenden zu der vorgelegten Frage wider. Spricht man nämlich von der 
größeren oder kleineren Wahrscheinlichkeit einer bestimmten Aussage, so hat 
man gewöhnlich nicht die Absicht, die Anwendbarkeit des Prinzips des aus- 
geschlossenen Dritten einem Zweifel zu unterwerfen, z. B. wird niemand daran 
zweifeln, daß in Wirklichkeit jede der beiden Aussagen a) und b) entweder 
wahr oder falsch ist. Wenn auch die sog. Intuitionisten bezüglich der Aussage a) 
ähnliche Zweifel hegen, so hängt doch in der üblichen Auffassung in jedem 
Falle die Möglichkeit, von der größeren oder kleineren Wahrscheinlichkeit 
dieses Satzes zu sprechen, nicht mit Zweifeln an der Anwendbarkeit des Prin- 
zips vom ausgeschlossenen Dritten auf diesen Satz zusammen. Wenn irgend- 
wann einmal die Behauptung a) bewiesen oder widerlegt sein wird, so ver- 
lieren alle vorläufigen jetzt ausgesprochenen Abschätzungen ihrer Wahr- 
scheinlichkeit ihren Sinn. Ebenso wird man am 7. Mai 1969 leich entscheiden 
können, ob die Aussage b) wahr oder falsch ist: Wenn an diesem Tage Schnee 
fällt, so verliert die Ansicht, daß dieses Ereignis wenig wahrscheinlich ist, jeg- 
lichen Sinn. 

Eine vollständige Untersuchung der vielfältigen psychischen Grade des 
Zweifelns, die zwischen der kategorischen Bejahung und der kategorischen 
Verneinung einer einzelnen Aussage liegen, würde uns jedoch — so interessant 
sie auch für die Psychologie wäre — von unserer Hauptaufgabe ablenken, das 
Wesen der wahrscheinlichkeitstheoretischen Gesetzmäßigkeiten zu erläutern. 
Diese besitzen — worauf wir schon hinwiesen — eine objektive wissenschaft- 
liche Bedeutung. 


$ 3. Das Ereignisfeld 


Im vorhergehenden Paragraphen sahen wir, daß die Definition der mathe- 
matischen Wahrscheinlichkeit als eines quantitativen Maßes für den „Über- 
zeugtheitsgrad‘“ des erkennenden Subjekts nicht den Inhalt des Begriffes der 
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Wahrscheinlichkeit erfaßt. Wir kehren im folgenden zu der Frage zurück, 
wie man zu den objektiven stochastischen Gesetzmäßigkeiten kommt. Eine 
einfache und direkte Antwort auf diese Frage wollen die klassische und die 
statistische Definition der Wahrscheinlichkeit geben. Wir werden später sehen, 
daß diese beiden Definitionen wesentliche Seiten des realen Inhalts des Be- 
griffes der Wahrscheinlichkeit wiedergeben. Jedoch ist jede von ihnen einzeln 
genommen unzureichend. Für ein volles Verständnis des Wesens der Wahr- 
scheinlichkeit ist ihre Synthese erforderlich. In den nächsten Paragraphen 
beschäftigen wir uns ausschließlich mit der klassischen Definition der Wahr- 
scheinlichkeit. Diese geht von der Vorstellung aus, daß die Gleichmöglichkeit 
eine objektive Eigenschaft ist, die den verschiedenen möglichen Varianten des 
Verlaufs der zu untersuchenden Erscheinungen aufGrund ihrer realen Sym- 
metrien zukommt. Nur mit einer solchen Vorstellung von der Gleichmöglich- 
keit werden wir es im folgenden zu tun haben. Die Definition der Wahrschein- 
lichkeit durch „Gleichmöglichkeit“, aufgefaßt in dem rein subjektiven Sinn 
einer gleichen „Wahrheitsähnlichkeit“ für das erkennende Subjekt, ist jedoch 
nur in ihrer äußeren Form von den Definitionen der Wahrscheinlichkeit durch 
den „Überzeugtheitsgrad“ des erkennenden Subjekts verschieden; letztere 
haben wir aber von unseren Betrachtungen ausgeschlossen. 

Bevor wir zur klassischen Definition des Begriffes der Wahrscheinlichkeit 
übergehen, machen wir noch einige Vorbemerkungen. Fest vorgegeben sei 
uns ein Komplex © von Bedingungen. Wir wollen dann ein gewisses System 
S von Ereignissen A, B, C,... betrachten!). Bei jeder Realisierung des Kom- 
plexes © kann jedes von diesen Ereignissen eintreten, es braucht aber nicht 
einzutreten. Zwischen den Ereignissen des Systems S können gewisse Be- 
ziehungen bestehen, mit denen wir es ständig zu tun haben werden. Wir 
wollen sie daher zunächst untersuchen. 


1. Wenn bei jeder Realisierung des Komplexes & von Bedingungen, bei der 
das Ereignis A eintritt, stets auch das Ereignis B eintritt, so sagen wir, A ziehe 
B nach sich?) und schreiben 


A<B 
oder 
B>A. 


2. Wenn A das Ereignis B nach sich zieht und gleichzeitig B ein Teilereignis 
von A ist, d. h., wenn bei jeder Realisierung des Komplexes © die Ereignisse A 
und B entweder beide auftreten oder beide nicht auftreten, so sagen wir, die 
Ereignisse A und B seien gleichwertig, und bezeichnen diesen Sachverhalt durch 
das Symbol A = B. 


!) Ereignisse werden im folgenden mit großen lateinischen Buchstaben A, B, C, D, 
E,... bezeichnet. 
2) Anstelle von „A zieht B nach sich‘ sagt man auch „A ist ein Teilereignis- von B“. 
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3. Das Ereignis, das im gleichzeitigen Auftreten der Ereignisse A und B 
besteht, nennen wir das Produkt der Ereignisse A und B und bezeichnen es 
mit AB. 


4. Das Ereignis, das darin besteht, daß mindestens eines der Ereignisse A 
und B eintritt, nennen wir die Summe der Ereignisse A und B und schreiben 
dafür A+ B. 


5. Das Ereignis, das darin besteht, daß das Ereignis A eintritt, während B 
nicht eintritt, nennen wir die Differenz der Ereignisse A und B und schreiben 
dafür A—B. 


Der Komplex © bestehe z.B. darin, daß auf gut Glück innerhalb des in 
Abb. 1 gezeichneten Quadrates irgendein Punkt gewählt wird, der auf keinem 


A 


in dieser Abbildung dargestellten Kreise liegt. Wir bezeichnen mit A das Er- 
eignis „der ausgewählte Punkt liegt innerhalb des linken Kreises“, und mit 
B das Ereignis „der ausgewählte Punkt liegt innerhalb des rechten Kreises“. 
Dann bestehen die Ereignisse A, A, B, B, A + B, AB darin, daß der aus- 
gewählte Punkt in das auf den entsprechenden Figuren von Abb. 1 schraffierte 
Gebiet fällt. 

Wir betrachten ein weiteres Beispiel. Der Komplex © bestehe darin, daß 
auf einen Tisch (einmal) ein Würfel geworfen wird, auf dessen Flächen jeweils 
1, 2, 3, 4, 5 und 6 Augen markiert sind. Wir bezeichnen mit A das Ereignis, 
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daß auf der oberen Fläche des Würfels 6 Augen erscheinen, mit B das Auf- 
treten von 3 Augen, mit C das Auftreten irgendeiner geraden Anzahl von 
Augen, mit D das Auftreten irgendeiner Anzahl von Augen, die durch 3 teilbar 
ist. Dann hängen die Ereignisse A, B, C und D durch die folgenden Bezie- 
hungen zusammen: 


A<C, ASZD B<cD, A+rB=D CD=A. 


Die Definition der Summe und des Produktes zweier Ereignisse läßt sich auf 
eine beliebige Anzahl von Ereignissen verallgemeinern: 


A+B+-+N 


bezeichnet dasjenige Ereignis, das im Auftreten wenigstens eines der Ereig- 
nisse A,B,C,...,N besteht, während 


AB...N 


dasjenige Ereignis bezeichnet, das im Auftreten aller Ereignisse A, B,..., N 
besteht. 


6. Ein Ereignis heißt sicher, wenn es mit Notwendigkeit (bei jeder Reali- 
sierung des Komplexes ©) eintreten muß. Bei einem Wurf mit zwei Würfeln 
ist es z. B. sicher, daß die Summe der Augen nicht kleiner als zwei ist. 

Ein Ereignis heißt unmöglich, wenn es niemals (bei keiner Realisierung des 
Komplexes & von Bedingungen) eintreten kann. Bei einem Wurf mit zwei 
Würfeln ist es z. B. unmöglich, daß die Summe der Augen gleich 13 ist. 

Offenbar sind alle sicheren Ereignisse einander gleichwertig. Daher schreibt 
man auch für alle sicheren Ereignisse ein und denselben Buchstaben. Wir be- 
nutzen hierfür den Buchstaben U, Ebenso sind alle unmöglichen Ereignisse 
einander gleichwertig. Wir bezeichnen sie mit dem Buchstaben V. 


7. Zwei Ereignisse A und A heißen einander enigegengeseizi, wenn für sie 
gleichzeitig die beiden folgenden Bedingungen erfüllt sind: 
A+A=U, AA=V. 


Wird z. B. beim Wurf eines Würfels mit © das Auftreten einer geraden Anzalıl 
von Augen bezeichnet, so ist 


U-C=C 
das Ereignis, das im Auftreten einer ungeraden Anzahl von Augen besteht. 
8. Zwei Ereignisse A und B heißen unvereinbar, wenn ihr gleichzeitiges Auf- 
treten unmöglich ist, d. h. wenn 
AB=YV 

ist. Gilt 

A=B+B+"-+DB, 
und sind die Ereignisse B, paarweise unvereinbar, d.h. 

BB,=V für i#j, 
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dann sagt man, das Ereignis A lasse sich in die Teilereignisse B,, By,..., Bu 
zerlegen. So läßt sich z. B. beim Wurf eines Würfels das Ereignis C, das im 
Auftreten einer geraden Anzahl von Augen besteht, in die Teilereignisse E,, E,, 
E, zerlegen, die entsprechend in dem Auftreten von 2,4 und 6 Augen bestehen. 

Die Ereignisse B,, B,, . . . , B„ bilden eine vollständige Gryppe von Ereignissen, 
wenn mindestens eines von ihnen (bei jeder Realisierung des Komplexes ©) 
eintreten muß, d.h. wenn 


B+B+"-+B=U 


gilt. Besonders wichtig sind für uns im folgenden die vollständigen Gruppen 
paarweise unvereinbarer Ereignisse. Eine solche Gruppe ist z. B. bei einmaligem 
Wurf eines Würfels das System der Ereignisse 


Ey Ey Ey, Ey, E,, E,, 
die entsprechend im Auftreten von 1, 2, 3, 4, 5 und 6 Augen bestehen. 


9. In jeder Aufgabe der Wahrscheinlichkeitsrechnung hat man es mit irgend- 
einem bestimmten Komplex & von Bedingungen und mit irgendeinem Sy- 
stem S von Ereignissen zu tun, die nach jeder Realisierung des Komplexes 
eintreten oder nicht eintreten können. Bezüglich dieses Systems macht man 
zweckmäßigerweise folgende Annahmen: 


a) Gehören dem Syslem S die Ereignisse A und B an, so gehören ihm auch 
die Ereignisse AB, A + BBA—B an. 


b) Das System enthält die sicheren und die unmöglichen Ereignisse. 


Ein System, das diesen Annahmen genügt, heißt ein Ereignisjeld. 

Wir bemerken noch zum Schluß, daß man in allen Betrachtungen der Wahr- 
scheinlichkeitsrechnung gleichwertige Ereignisse miteinander vertauschen kann. 
Zwei beliebige gleichwertige Ereignisse wollen wir daher im folgenden als 
identisch ansehen. 
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Die klassische Definition der Wahrscheinlichkeit führt den Begriff der Wahr- 
scheinlichkeit auf den der Gleichwahrscheinlichkeit (Gleichmöglichkeit) von 
Ereignissen zurück, der als grundlegend gilt und keiner weiteren Definition 
unterliegt. Z.B. werden beim Wurf eines Würfels, der eine einwandfreie 
kubische Gestalt besitzt und aus vollkommen homogenem Material gefertigt 
ist, das Auftreten von 1, 2, 3, 4, 5 und 6 Augen gleichmögliche Ereignisse sein, 
denn auf Grund der Symmetrie ist keine Seite des Würfels vor einer andern 
ausgezeichnet. 

Im allgemeinen Falle betrachten wir irgendeine Gruppe G, die aus n paar- 
weise unvereinbaren gleichmöglichen Ereignissen (wir nennen sie elementare 
Ereignisse) besteht: 

E, En :.:sEn 
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und bilden das System F aus dem unmöglichen Ereignis V, allen Ereignissen E} 
der Gruppe G und allen Ereignissen A, die sich in Teilereignisse der Gruppe G 
zerlegen lassen. 

Besteht z.B. die Gruppe G aus den drei Ereignissen E,, E, und E,, so ent- 
hält das System F die Ereignisse!) 


VEEBE,E+EB+EE+E,U=E+E+E,. 


Man prüft leicht nach, daß das System F ein Ereignisfeld ist. Es ist offen- 
sichtlich, daß Summe, Differenz und Produkt von Ereignissen aus F wieder in 
F liegen. Das unmögliche Ereignis V liegt nach Definition in F, und das 
sichere Ereignis U liegt ebenfalls in F, da es sich in der Form 


U=E+BE+- +E, 
darstellen läßt. 

Die klassische Definition der Wahrscheinlichkeit bezieht sich auf die Er- 
eignisse des Systems F und läßt sich folgendermaßen formulieren: Wenn sich 
ein Ereignis A in m Teilereignisse zerlegen läßt, die alle zu einer vollständigen 
Gruppe von n paarweise unvereinbaren und gleichmöglichen Ereignissen gehören, 
so ist die Wahrscheinlichkeit P(A) des Ereignisses A gleich 


P(A) --. 


Bei einmaligem Wurf eines Würfels besteht z. B. eine vollständige Gruppe paar- 
weise unvereinbarer und gleichmöglicher Ereignisse aus den Ereignissen 


Ey, Ey Ey Eu Ey Ei» 
die das Auftreten von 1, 2, 3, 4, 5 und 6 Augen bedeuten sollen. Das Ereignis 
C=E+E,+E, 
das im Auftreten einer geraden Anzahl von Augen besteht, läßt sich in drei 
Teilereignisse zerlegen, die in der vollständigen Gruppe unvereinbarer und 


gleichmöglicher Ereignisse vorkommen. Die Wahrscheinlichkeit des Ereig- 
nisses © ist daher gleich 


Ebenso ist es offensichtlich, daß auf Grund unserer Definition gilt 
PE)=z, 1<i<6, 


2 1 


PE+E)==z 


= » 
usw. 

!) Durch diese 8 Ereignisse wird das System F erschöpft, wenn man (wie wir es sei 
dem Ende des $3 tun wollen) einander gleichwertige Ereignisse nicht unterscheidet 
Man zeigt leicht, daß im allgemeinen Falle einer Gruppe @ von n Ereignissen das System F 
aus 2” Ereignissen besteht. 
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In der Wahrscheinlichkeitsrechnung wird weitgehend folgende Terminologie 
verwandt, an die wir uns im folgenden oft halten werden. Um festzustellen, 
ob ein Ereignis A (etwa das Erscheinen einer durch 3 teilbaren Anzahl von 
‚Augen) eintritt oder nicht, muß man unbedingt einen Versuch ausführen 
(d.h. den Komplex & von Bedingungen realisieren), der eine Antwort auf die 
gestellte Frage gibt (in unserem Beispiel muß der Würfel tatsächlich einmal 
geworfen werden). Eine vollständige Gruppe paarweise unvereinbarer und 
gleichwahrscheinlicher Ereignisse, die bei einem solchen Versuch eintreten 
können, heißt eine vollständige Gruppe möglicher Versuchsergebnisse. Die- 
jenigen möglichen Versuchsergebnisse, aus denen sich das Ereignis A zu- 
sammensetzt, heißen Versuchsergebnisse, die A begünstigen. In Benutzung 
dieser Terminologie kann man sagen, daß die Wahrscheinlichkeit P(A) eines 
Ereignisses A gleich dem Verhältnis der Anzahl der für das Ereignis A günstigen 
zur Anzahl aller möglichen. Versuchsergebnisse ist. 

Eine solche Definition setzt natürlich voraus, daß die einzelnen möglichen 
Versuchsergebnisse gleichwahrscheinlich sind. 

Betrachten wir z. B. den Wurf zweier Würfel. Wenn es sich um „richtige“ 
Würfel handelt, so ist das Auftreten einer jeden der 36 möglichen Kombina- 
tionen der Augenzahlen auf dem ersten und zweiten Würfel gleichwahrscheinlich. 
Wir sagen daher, die Wahrscheinlichkeit des Auftretens von insgesamt 12 Augen 


sei gleich . Das Auftreten von 11 Augen ist auf zweierlei Art möglich: ein- 


mal auf dem ersten Würfel 5 und auf dem anderen 6 und zum anderen Mal auf 


dem ersten Würfel 6 und auf dem zweiten 5 Augen. Die Wahrscheinlichkeit, 


daß die Summe der Augenzahl gleich 11 ist, beträgt daher = = nr . Der Leser 
prüft leicht nach, daß die Wahrscheinlichkeiten des Auftretens der einzelnen 
Anzahlen von Augen in der folgenden Tabelle richtig angegeben sind. 


Tabelle 1 


NENESESKEEBESEZEZEIEN 
1 


2 ı15|6)5|4 
36 | 36 | 36 | 36 | 36 


Entsprechend unserer Definition wird jedem Ereignis A, das dem oben kon- 
struierten Wahrscheinlichkeitsfeld angehört, eine wohlbestimmte Wahrschein- 
lichkeit 


Augenzahl 


Wahrscheinlichkeit ... 


P(A) = - 


zugeschrieben. Dabei ist m die Anzahl derjenigen Ereignisse E, der Ausgangs- 
gruppe G, die Teilereignisse von A sind. Auf diese Weise läßt sich die Wahr- 
scheinlichkeit P (A) als eine auf dem Wahrscheinlichkeitsfeld F definierte Funktion 
des Ereignisses A deuten. Diese Funktion besitzt die folgenden Eigenschaften: 


3 Gnedenko 
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1. Für jedes Ereignis A des Wahrscheinlichkeitsfeldes F gilt 


P(A)>0. 
2. Für das sichere Ereignis U gilt 
RU)=1. 


3. Läßt sich das Ereignis A in die Teilereignisse B und C zerlegen und gehören 
alle drei Ereignisse A, B und C dem Feld F an, so ist 


P(A)=P(B) + P(Q). 
Diese Eigenschaft nennt man das Additionstheorem der Wahrscheinlichkeiten. 
Die Eigenschaft 1. ist evident, denn der Bruch — kann nie negativ sein. 


Eigenschaft 2. ist nicht weniger einleuchtend, da für das sichere Ereignis U 
alle n möglichen Versuchsergebnisse günstig sind. Daher ist 


RUD)=—=1. 


Wir beweisen nun die Eigenschaft 3. Für das Ereignis B seien m’, für das 
Ereignis C hingegen m’’ Elementarereignisse E; der Gruppe G günstig. Da die 
Ereignisse B und C nach Annahme unvereinbar sind, unterscheiden sich die- 
jenigen Ereignisse E,, die für B günstig sind, von denen, die für C günstig sind. 
Im ganzen haben wir also m’ + m’’ Elementarereignisse E,, die für das Auf- 
treten irgendeines der Ereignisse B oder C günstig sind, d.h. die das Ereignis 
B+C=A begünstigen. Folglich ist 


m’ + m!' m’ m'' 
P(A) a ze 0 ac ae P(B) + PCC), 
q.e.d. 
Wir beschränken uns an dieser Stelle auf einen Hinweis auf einige weitere 
Eigenschaften der Wahrscheinlichkeit. = 
4. Die Wahrscheinlichkeit des dem Ereignis A entgegengesetzien Ereignisses A 
ist gleich 


P(A) = 1—P(4). 
Wegen 
A+A=U 
ist nämlich auf Grund der bewiesenen Eigenschaft 2 
PA+A)=1. 


Da aber die Ereignisse A und A miteinander unvereinbar sind, so gilt nach 
Eigenschaft 3 


P(A + A) = P(A) + P(A). 


Die beiden letzten Gleichungen beweisen unseren Satz. 
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5. Die Wahrscheinlichkeit des unmöglichen Ereignisses ist gleich Null. 
Die Ereignisse U und V sind nämlich unvereinbar, daher ist 


PU) + P(V)=P(U). 


Hieraus folgt dann aber. 
PV)=0. 
6. Wenn das Ereignis A das Ereignis B nach sich zieht, so ist 
P(A)<P(B). 


Das Ereignis B läßt sich nämlich als Summe der beiden Ereignisse A und 
AB darstellen. Hieraus gewinnen wir auf Grund der Eigenschaften 3 und 1 die 
Beziehung 

P(B) = P(A + AB) = P(A) + P(AB) > P(A). 


7. Die Wahrscheinlichkeit eines beliebigen Ereignisses liegt zwischen den 
Zahlen O und 1. 


Für ein beliebiges Ereignis A gelten nämlich die Beziehungen 
VSCA+V=A=AUC<CTU; 


hieraus ergeben sich auf Grund der bisher angeführten Eigenschaften die Un- 
gleichungen 
0=PM<SPA)<PU=1. 


$& 5. Beispiele 


Wir betrachten nun einige Beispiele für die Berechnung der Wahrscheinlich- 
keiten von Ereignissen unter Benutzung der klassischen Definition der Wahr- 
scheinlichkeit. Die von uns angeführten Beispiele tıagen ausschließlich einen 
illustrativen Charakter und sind nicht dazu bestimmt, den Leser mit allen 
wichtigen Methoden der Berechnung von Wahrscheinlichkeiten vertraut zu 
machen. 


Beispiel 1. Aus einem Kartenspiel (36 Karten) greift man auf gut Glück 
3 Karten heraus. Gesucht ist die Wahrscheinlichkeit dafür, daß sich unter 
ihnen genau ein As befindet. 


Lösung. Die vollständige Gruppe gleichwahrscheinlicher und unvereinbarer 
Ereignisse besteht in unserer Aufgabe aus allen möglichen Kombinationen von 
3 Karten, ihre Anzahl ist gleich C3,!). Die Anzahl der günstigen Ereignisse 
kann man folgendermaßen berechnen. Ein As können wir auf Ci verschiedene 
Arten wählen, zwei andere Karten (keine Asse) hingegen auf C5, verschiedene 
Arten. Da zu jedem As die beiden übrigen Karten noch auf C}, Arten ge- 


!) In der internationalen Literatur wird gelegentlich diese Bezeichnung benutzt. Es ist 
C#k = (}) (Anm. d. Red.). 


3* 
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wählt werden können, so gibt es im ganzen C} C3, günstige Fälle. Die gesuchte 
Wahrscheinlichkeit ist also gleich 


4 32.31 
c1.c8, 11.2 31.16 4 
u GG 36.35.34 38.3.17 1788 12728 
1:2:3 


d..h. ein wenig größer als 0,25. 


Beispiel 2. Aus einem Kartenspiel (36 Karten) werden auf gut Glück 
3 Karten gezogen. Gesucht ist die Wahrscheinlichkeit dafür, daß unter ihnen 
wenigstens ein As vorkommt. 


Lösung. Wir bezeichnen das uns interessierende Ereignis mit dem Buch- 
staben A. Es läßt sich als Summe der folgenden 3 unvereinbaren Ereignisse 
darstellen: A, — das Auftreten eines einzigen Asses, A, — das Auftreten von 
genau 2 Assen, A, — das Auftreten von 3 Assen. 

Durch analoge Überlegungen wie bei der Lösung der vorigen Aufgabe stellt 
man leicht fest, daß die Anzahl der günstigen Fälle für 


das Ereignis A, gleich C}- Ch, , 
EL) Ag LE} G- Ch ’ 


[2 Az E23] G * GC; 
ist. 
Da die Anzahl aller möglichen Fälle gleich C}, ist, erhält man 
c1. A _ 16-31 


P(A,) = SET 0,2778, 
Er c- Ei En 3-16 Er 
P(A,) = G "Tan" 0,0269, 
2.0), = 1 Z 
PlA) = "Gr = 535.77 * 0,0006. 
Auf Grund des Additionstheorems ist dann 
P(A) = P(A,) + P(A,) + P(A,) = ns rs 0,3053 . 


Dieses Beispiel läßt sich auch noch anders lösen. Das dem Ereignis A ent- 


gegengesetzte Ereignis A besteht darin, daß unter den herausgegriffenen Karten 
kein As vorkommt. Offensichtlich kann man aus dem Kartenspiel nach Ent- 
fernen der 4 Asse noch auf C}, verschiedene Arten drei Karten herausgreifen, 
folglich erhält man 


36 i 


Die gesuchte Wahrscheinlichkeit ist gleich 
P(A) = 1— P(A) » 0,3053 . 
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Bemerkung. In beiden Beispielen besagt der Ausdruck „auf gut Glück“ 
daß alle möglichen Kombinationen von 3 Karten gleichwahrscheinlich sind. 


Beispiel 3. Ein aus 36 Karten bestehendes Kartenspiel werde auf gut 
Glück in zwei gleichgroße Stöße geteilt. Wie groß ist die Wahrscheinlichkeit, 
daß in beiden Stößen die gleiche Anzahl roter und schwarzer Karten vor- 
handen ist? 

Der Ausdruck „auf gut Glück‘ besagt hier, daß alle möglichen Aufteilungen 
des Kartenspiels in 2 gleiche Teile gleichwahrscheinlich sind. 

Lösung. Wir müssen die Wahrscheinlichkeit dafür suchen, daß unter den 
auf gut Glück herausgegriffenen 18 Karten 9 rote und 9 schwarze sind. 

Aus 36 Karten kann man auf C# verschiedene Arten 18 Karten auswählen. 
Für unser Beispiel günstig sind alle die, bei denen von den 18 roten Karten 
des Spieles gerade 9 und von den 18 schwarzen Karten ebenfalls gerade 9 
herausgegriffen werden. 9 rote Karten kann man aber auf C}, verschiedene 
Arten entnehmen. Da man.nach Entnahme eines ganz bestimmten Satzes 
von 9 roten Karten noch auf C}, verschiedene Arten 9 schwarze ziehen kann, 
ist die Anzahl der günstigen Fälle gleich C}, - C};. Als gesuchte Wahrschein- 
lichkeit erhält man also 

_ Os Ci: _ 8) 
‚u: co 36918 ' 
Um uns eine Vorstellung von der Größe dieser Wahrscheinlichkeit zu machen 
und dabei nicht irgendwelche ermüdende Berechnung anstellen zu müssen, 
benutzen wir die StikLisssche Formel. Nach dieser gilt die folgende asym- 


ptotische Gleichung 
nlwyannn"e*. 


18! w 18W rw Yin: 18, 


1wWPery2r-9, 
361 ru 369% . e726 2:36, 


ee 
Ver: 36 - 3688. 9 (Y 2.9.99 .er®)@" 


Nach einigen einfachen m bekommen wir schließlich 
Pr Tr 
Beispiel 4. Vorgegeben seien n a von denen sich jedes mit ein 


und derselben Wahrscheinlichkeit —-in jedem von N(N > n) Kästchen befinden 


kann. Gesucht ist die Wahrscheinlichkeit dafür, daß sich 
1. in n ausgewählten Kästchen je 1 Teilchen befindet, 
2. in beliebigen n Kästchen je 1 Teilchen befindet. 


Wir haben also 


und damit 


ner; 2» 0,26. 
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Lösung. Diese Aufgabe spielt in der modernen statistischen Physik eine 
wichtige Rolle; je nachdem, wie die vollständige Gruppe gleichwahrscheinlicher 
Ereignisse gebildet wird, kommt man zu der physikalischen Statistik von 
BOLTZMANN, BosE-EINSTEIN oder von FERMI-DIRAC. 

In der BoLrzmannschen Statistik werden zwei beliebige denkbare Verteilungen 
als gleichwahrscheinlich angesehen: In jedem Kästchen kann sich eine beliebige 
Anzahl von Teilchen befinden, die von 0 bis n variieren kann; und jede Per- 
mutation der Teilchen schafft eine neue Verteilung. 

Die Anzahl der möglichen Verteilungen bestimmen wir folgendermaßen: 
Jedes Teilchen kann sich in jedem der N Kästchen befinden, folglich können 
sich n Teilchen auf N" verschiedene Arten auf die Kästchen verteilen. 

In der ersten Frage ist die Anzahl der günstigen Fälle offenbar gleich nl, 
also die Wahrscheinlichkeit dafür, daß in n vorher ausgewählte Kästchen je 
ein Teilchen fällt, gleich 


_nt 
 .S 


In der zweiten Frage ist die Anzahl der günstigen Fälle C} mal so groß, 
daher ist die Wahrscheinlichkeit dafür, daß in irgend n Kästchen je 1 Teilchen 
fällt, gleich 

_ On _ N! 
Pa = ya Nun 

In der Bosz-Eiwsrersschen Statistik sieht man alle die Fälle als identisch 
an, die durch Vertauschen der Teilchen ineinander übergehen (wichtig ist nur, 
wie viele Teilchen in ein Kästchen fallen, jedoch nicht, welche Teilchen es sind). 
Die vollständige Gruppe gleichwahrscheinlicher Ereignisse besteht aus allen 
möglichen Verteilungen von n Teilchen auf N Kästchen, wobei man die ganze 
Klasse von BoLtzmannschen Verteilungen, die sich nicht durch die Anzahl 
der auf die einzelnen Kästchen entfallenden Teilchen, sondern nur durch die 
Teilchen selbst unterscheiden, zu einem einzigen Fall zusammenfaßt. Um eine 
anschauliche Vorstellung vom Unterschied der BoLrzmannschen und der Bosz- 
Eınsteisschen Statistik zu bekommen, betrachten wir ein spezielles Beispiel: 
N=4, n=2. Alle möglichen Verteilungen lassen sich in diesem Beispiel 
in Form der folgenden Tabelle zusammenfassen, a und b mögen dabei die 


Tabelle 2 


ERIERSIERREBAREN 
[3 


Kästchen 


$5. Beispiele 25 


beiden Teilchen bezeichnen. In der Borrtzmansschen Statistik sind alle 
16 Möglichkeiten verschiedene gleichwahrscheinliche Ereignisse, in der Bosr- 
Ermssteisschen Statistik dagegen werden die Fälle 5 und 11, 6 und 12, 7 und 13, 
8 und 14, 9 und 15, 10 und 16 paarweise identifiziert, so daß wir eine Gruppe 
von 10 gleichwahrscheinlichen Ereignissen bekommen. 

Wir berechnen nun die Anzahl der gleichwahrscheinlichen Fälle in der 
Bosr-Emsteisschen Statistik. Dazu bemerken wir, daß man die möglichen 
Verteilungen der Teilchen auf die verschiedenen Kästchen auf folgende Weise 
erhalten kann: Wir ordnen die Kästchen auf einer Geraden dicht nebeneinander 
an, ferner ordnen wir auch die Teilchen eins neben dem anderen auf der selben 
Geraden in einer Reihe an. Wir betrachten nun alle möglichen Permutationen 
der n Teilchen und N — 1 Trennungswände zwischen den Kästchen (insgesamt 
N +n—.1 Elemente). Wie man sich leicht überlegt, werden auf diese Weise 
alle möglichen Besetzungen der Kästchen mit Teilchen berücksichtigt, die sich 
sowohl durch die Anordnung der Teilchen in den Kästchen, als auch durch 
die Ordnung der Trennungswände unterscheiden. 

Die Anzahl dieser Permutationen ist gleich (N +n—-1)! Unter diesen 
Permutationen kommen aber identische vor: Jede Verteilung der Teilchen auf 
die Kästchen wird (N — 1)!-mal gezählt, da wir unterschieden, welche Zwischen- 
wände zwischen den Kästchen lagen. Außerdem zählten wir jede Verteilung 
auf die Kästchen n!-mal, da wir nicht nur die Anzahl der Teilchen in einem 
Kästchen, sondern auch die Reihenfolge der Teilchen in diesem Kästchen be- 
rücksichtigten. Jede Verteilung auf die Kästchen zählten wir also n!(N — 1)I- 
mal. Die Anzahl der im Sinne von Basr-Einsteın verschiedenen Verteilungen 
der Teilchen auf die Kästchen ist also gleich 

(+ N—1)! 


Damit haben wir die Anzahl der gleichwahrscheinlichen Ereignisse in der 
vollständigen Gruppe von Ereignissen gefunden. Nunmehr können wir auch 
leicht die Fragen unserer Aufgabe beantworten. In der Bosz-Einsteinschen 
Statistik sind die Wahrscheinlichkeiten p, und p, gleich 


u 1 an)! 
A=m+N-NM GrNıy 
add 
a CR es NUN —D! 
Pa men DT NW tan‘ 
an —ıı 


Zum Schluß betrachten wir noch die Fermi-Dieacsche Statistik. Nach dieser 
Statistik kann ein Kästchen entweder mit einem einzigen Teilchen besetzt 
sein oder mit keinem; Vertauschung der Teilchen schafft keine neue Verteilung. 

Die Anzahl der verschiedenen Verteilungen der Teilchen auf die Kästchen 
läßt sich nun in der Fermi-Diracschen Statistik leicht berechnen. Das erste 
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Teilchen kann auf N verschiedene Arten angeordnet werden, das zweite nur 
auf N—1, das dritte auf N — 2 und schließlich das n-te auf (N—n +1) 
verschiedene Arten. Als verschieden sehen wir hierbei noch die Verteilungen 
an, die sich nur durch eine Permutation der Teilchen unterscheiden. Daher 
müssen wir die so gewonnene Zahl durch n! dividieren. n Teilchen können 
also auf-die N Kästchen auf 
1 N! 
ra a ai le 2 Sn (N—a)ın! 
verschiedene gleichwahrscheinliche Arten verteilt werden. 
Man überlegt sich leicht, daß in der Fermı-Diracschen Statistik die gesuchten 
Wahrscheinlichkeiten gleich 
_(N—n)tn! 
Pı = — N. ’ 
m=1 
sind. 
Das betrachtete Beispiel zeigt, wie wichtig es ist, genau festzulegen, welche 
Ereignisse in der Aufgabe als gleichwahrscheinlich anzusehen sind. 


Beispiel 5. An einer Theaterkasse stehen 2 rn Menschen in einer Reihe an. 
n Leute haben nur Fünfmarkscheine, die übrigen n nur Zehnmarkscheine. 
Zu Beginn des Kartenverkaufs ist in der Kasse kein Geld vorhanden, jeder 
Käufer nimmt eine Eintrittskarte zu 5Mark. Wie groß ist die Wahrschein- 
lichkeit dafür, daß die Käufer hintereinander abgefertigt werden können, ohne 
auf Wechselgeld warten zu müssen ? 


Lösung. Alle möglichen Anordnungen der Käufer sind gleichwahrscheinlich, 
uns interessiert aber nicht die Anordnung der Käufer selbst, sondern nur der 
Käufer, der Fünfmarkscheine, und der Käufer, der Zehnmarkscheine hat. 
Zur Lösung der uns interessierenden Aufgabe benutzen wir folgendes geo- 
metrisches Verfahren: Wir betrachten die xy-Ebene und zeichnen auf der 
Abszissenachse der Punkte 1, 2, ..., 2n in dieser Reihenfolge ein. Im Koordi- 
natenanfangspunkt liege die Kasse. Jeder Person, die einen Zehnmarkschein 
besitzt, ordnen wir die Ordinate +1 zu und jeder Person mit einem Fünf- 
markschein die Ordinate —l. Nun summieren wir von links nach rechts 
die so definierten Ordinaten in den ganzzahligen Punkten und zeichnen in 
jedem dieser Punkte die erhaltene Summe ein (s. Abb. 2). Man sieht leicht, 
daß im Punkt mit der Abszisse 2n diese Summe gleich Null ist (es kommt 
n mal Summand 1 und n mal Summand —i vor). Wir verbinden jetzt die 
so erhaltenen einander benachbarten Punkte durch Geraden und den Ko- 
ordinatenursprung mit dem ersten dieser Punkte von links gerechnet. Den so- 
gewonnenen Streckenzug nennen wir eine Trajektorie. Die Anzahl der ver- 
schieden möglichen Trajektorien ist — wie man leicht einsieht — gleich C}, 
(sie ist gleich der Anzahl der möglichen Kombinationen von n Aufwärtsbewe- 
gungen unter 2n Aufwärts- und Abwärtsbewegungen). Für das uns inter- 
essierende Ereignis günstig sind solche und nur solche Trajektorien, die nirgends 
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über der Abszissenachse verlaufen (sonst kommt einmal ein Käufer zur Kasse 
mit einem Zehnmarkschein, während in der Kasse kein Wechselgeld ist). Wir 
berechnen nun die Anzahl der Trajektorien, die wenigstens einmal die Gerade 
y=1 erreichen oder schneiden. Dazu konstruieren wir eine neue Trajektorie 
folgendermaßen: Bis zur ersten Berührung mit der Geraden y=1 fällt die 
neue Trajektorie mit der alten zusammen und vom ersten Berührungspunkt 
ab ist die neue Trajektorie das Spiegelbild der alten Trajektorie an der Geraden 
y=1 (s. Abb. 2). Man sieht leicht, daß die neue Trajektorie nur für solche 
Trajektorien definiert ist, die wenigstens einmal die Gerade y =1 erreichen, 
für die übrigen Trajektorien (d.h. für die, welche für das uns interessierende 
Ereignis günstig sind), fällt die neue Trajektorie mit der alten zusammen. 
Eine neue Trajektorie, die im Punkt (0, 0) beginnt, endet im Punkt (2n, 2). 
Die neue Trajektorie bewegt sich also zweimal mehr nach oben als nach unten. 


EEERERNGEN: 
SHE 


Abb. 2 


Dieser Tatbestand zeigt uns, daß die Anzahl der neuen Trajektorien gleich 
C2+! ist (Anzahl der Kombinationen von n + 1 Aufwärtsbewegungen unter 
2n Aufwärts- und Abwärtsbewegungen). Die Anzahl der günstigen Fälle ist 
also gleich C}, — C3#" und die gesuchte Wahrscheinlichkeit ist gleich 
_ neh _ n ___1 
Pe ea 
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Schon am Anfang der Entwicklung der Wahrscheinlichkeitsrechnung be- 
merkte man, daß die klassische Definition der Wahrscheinlichkeit, die auf der 
Betrachtung endlicher Gruppen gleichwahrscheinlicher Ereignisse beruht, unzu- 
reichend ist. Schon damals führten spezielle Beispiele zu einer Abänderung 
dieser Definition und zu einer Bildung des Begriffs der Wahrscheinlichkeit 
auch in solchen Fällen, in denen unendlich -viele Versuchsergebnisse denkbar 
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sind. Dabei spielte wie vorher der Begriff der „Gleichwahrscheinlichkeit‘ 
gewisser Ereignisse eine grundlegende Rolle. 

Die allgemeine Aufgabe, die man sich stellte und die zur Erweiterung des 
Begriffs der Wahrscheinlichkeit führte, läßt sich folgendermaßen formulieren. 

Gegeben sei z.B. in einer Ebene ein gewisses Gebiet G. In ihm sei ein an- 
deres Gebiet g mit einer rektifizierbaren Berandung enthalten. Auf das Ge- 
biet G werde auf gut Glück ein Punkt geworfen, und man fragt sich, wie groß 
die Wahrscheinlichkeit dafür ist, daß der Punkt in das Gebiet g fällt. Dem 
Ausdruck „der Punkt wird auf gut Glück in das Gebiet G geworfen“ kommt 
dabei folgender Sinn zu: Der geworfene Punkt kann auf einen beliebigen 
Punkt des Gebietes G fallen, die Wahrscheinlichkeit dafür, daß er auf ein 
beliebiges Teilgebiet von G fällt, ist dem Maß dieses Teilgebietes (der Länge, 
dem Flächeninhalt usw.) proportional und hängt nicht von dessen Lage und 
Form ab. 

Damit ist definitionsgemäß die Wahrscheinlichkeit dafür, daß ein auf gut 
Glück in das Gebiet-G geworfener Punkt in das Gebiet g fällt, gleich 


Wir betrachten einige Beispiele. 


Beispiel 1. Aufgabe über die Begegnung. Zwei Personen A und B 
verabreden, sich an einem bestimmten Ort zwischen 12 und 1 Uhr zu treffen. 
Der zuerst Gekommene wartet auf den anderen 20 Minuten, danach geht 
er fort. Wie groß ist die Wahrscheinlichkeit dafür, daß sich die Personen A 


und B treffen, wenn jede von ihnen im 
Verlauf der angegebenen Stunde auf 

gut Glück ankommen kann und die 

Ankunftszeiten der beiden voneinander 

unabhängig sind.!) | 

ist. Wir stellen x und y als kartesische | | 

Koordinaten in einer Ebene dar; als Maß- 20 60 
stabseinheit wählen wir eine Minute. Abb. 3 

Alle möglichen Ereignisse werden durch 

Punkte eines Quadrats mit den Seitenlängen 60 dargestellt; die für das Treffen 
günstigen Ereignisse liegen in dem gestrichelten Gebiet (Abb. 3). 


60 


Lösung. Wir bezeichnen die Ankunfts- 
zeit von A mit x und die von B mit y. 
Damit sich beide treffen, ist notwendig 
und hinreichend, daß 20 


e—yl <20 


x 


1) Dies besagt, daß die Ankunitszeit der einen Person auf die Ankunftszeit der anderen 
keinen Einfluß hat. Der Begriff der Unabhängigkeit von Ereignissen wird in $ 9 genauer 
betrachtet. 
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Die gesuchte Wahrscheinlichkeit ist gleich dem Verhältnis des Flächeninhalts 
des gestrichelten Gebiets zum Flächeninhalt des ganzen Quadrats: 


Einige Ingenieure benutzten diese Begegnungsaufgabe zur Lösung des fol- 
genden Problems der Arbeitsorganisation. Ein Arbeiter bedient mehrere gleich- 
artige Maschinen, von denen jede in zufälligen Zeitpunkten die Aufmerksam- 
keit des Arbeiters erfordert. Es kann vorkommen, daß zu der Zeit, wo der 
Arbeiter an einer Maschine beschäftigt ist, sein Eingreifen an anderen Ma- 
schinen erforderlich ist. Gesucht ist die Wahrscheinlichkeit dieses Ereignisses, 
d.h. die mittlere Zeit, die die Maschine auf den Arbeiter warten muß. Wir 
bemerken jedoch, daß das Schema der Begegnungsaufgabe zur Lösung dieser 
praktischen Aufgabe wenig geeignet ist, da es überhaupt keine bestimmte Zeit 
gibt, während der die Maschinen unbedingt die Aufmerksamkeit eines Arbeiters 
erfordern; außerdem ist die Beschäftigungsdauer des Arbeiters an einer Ma- 
schine nicht konstant. Ferner muß man noch auf die Kompliziertheit der 
Rechnungen in der Aufgabe über die Begegnung für den Fall einer großen 
Anzahl von Personen (Maschinen) hinweisen. Diese Aufgabe muß man aber 
gerade sehr oft für eine große Anzahl von Maschinen lösen (in der Textil- 
industrie bedienen z. B. einige Arbeiter bis zu 280.Maschinen). 


Beispiel 2. Das BErTRAnDsche Paradoxon. Die Theorie der geometri- 
schen Wahrscheinlichkeiten ist häufig wegen der Willkür in der Bestimmung 
der Wahrscheinlichkeiten von Ereignissen einer Kritik unterworfen worden. 
Dabei kamen viele Autoren zu der Überzeugung, daß man für den Fall unendlich 
vieler möglicher Versuchsergebnisse nicht in der Lage sei, eine objektive, von 
der Berechnungsmethode unabhängige Bestimmung der Wahrscheinlichkeit 
durchzuführen. Als besonders markanten Vertreter dieses Skeptizismus kann 
man den französischen Mathematiker aus dem vorigen Jahrhundert JosErH 
BERTRAND anführen. In seinem Buch über Wahrscheinlichkeitsrechnung bringt 
er eine Reihe von Aufgaben über geometrische Wahrscheinlichkeiten, in denen 
das Resultat von der Lösungsmethode abhängt. Als Beispiel führen wir eine 
dieser Aufgaben an. 

Auf gut Glück wird in einem Kreis eine Sehne gezogen. Wie groß ist die 
Wahrscheinlichkeit dafür, daß ihre Länge die Länge der Seite eines einbe- 
schriebenen gleichseitigen Dreiecks übertrifft ? 

Lösung 1. Aus Symmetriegründen kann man von vornherein die Richtung 
der Sehne vorgeben. Wie ziehen einen Durchmesser senkrecht zu dieser Rich- 
tung. Offenbar übertreffen nur solche Sehnen die Seiten eines gleichseitigen 


!) In $9 werden wir sehen, daß auf Grund der Unabhängigkeit der Ankunftszeiten von 
A und B die Wahrscheinlichkeit dafür, daß A im Intervall von x bis x + h, B im Inter- 


vall von y bis y-+ s ankommt, gleich 2 on ist, sie ist proportional dem Flächeninhalt 


eines Rechtecks mit den Seiten h und s. 
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Dreiecks, die den Durchmesser in dem Intervall von einem Viertel bis zu 
Dreiviertel seiner Länge schneiden. Die gesuchte Wahrscheinlichkeit ist also 


gleich 5 ; 

Lösung 2. Aus Symmetriegründen kann man von vornherein einen End- 
punkt der Sehne auf dem Kreise festhalten. Die Tangente an den Kreis in 
diesem Punkt und zwei Seiten des einbeschriebenen regelmäßigen Dreiecks mit 


einer Spitze in diesem Punkte bilden drei Winkel von je 60°. Günstige Fälle 
sind hier nur die Sehnen, die in den mittleren Winkelraum fallen. Bei dieser 


Lösungsmethode ist also die gesuchte Wahrscheinlichkeit gleich 3 . 


Lösung 3. Um die Lage der Sehne festzustellen, genügt es, ihren Mittel- 
punkt vorzugeben. Damit eine Sehne der Bedingung der Aufgabe genügt, 
muß sich notwendig ihr Mittelpunkt innerhalb eines Kreises befinden, der 
konzentrisch zum vorgegebenen Kreis liegt, aber nur ar halben Radius be- 


sitzt. Der Flächeninhalt dieses kleinen Kreises ist gleich 1 T des sie var 
des gegebenen Kreises; die gesuchte Wahrscheinlichkeit jet also gleich 4 Ir 


Wir müssen nun eine Erklärung dafür suchen, woher die Mehrdeutigkeit der 
Lösung unserer Aufgabe kommt. Liegt die Ursache in der prinzipiellen Un- 
möglichkeit, die Wahrscheinlichkeit in Fällen mit unendlich vielen möglichen 
Versuchsergebnissen zu bestimmen, oder liegt sie darin, daß wir im Verlaufe 
der Lösung irgendwelche unzulässigen Annahmen gemacht haben ? 

Wie man leicht sieht, liegt alles daran, daß als Lösung ein und derselben 
Aufgabe die Lösungen dreier grundverschiedener Aufgaben angegeben werden, 
wobei man die Tatsache benutzt, daß in der Bedingung der Aufgabe der Be- 
griff, eine Sehne auf gut Glück zu ziehen, nicht festgelegt ist. 

In der ersten Lösung läßt man längs eines Durchmessers einen runden 
zylindrischen Stab rollen (Abb. Aa). Die Menge aller möglichen Haltepunkte 


N 


Ih. ® 


a) b) €) 
Abb, 4 


dieses Stabes ist gleich der Menge aller Punkte auf dem Durchmesser. Als 

gleichwahrscheinlich werden die Ereignisse betrachtet, die darin bestehen, daß 
go AT Töpper Stillstand in einem Intervall der Länge h erfolgt, wo immer auch dieses 
kervall auf dem Durchmesser liegt. 
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In der zweiten Lösung läßt man einen durch ein Scharnier in einem Punkt des 
Kreisumfanges befestigten Stab Schwingungen von höchstens 180° Ausschlag 
ausführen (Abb. 4b). Als gleichwahrscheinlich wird dabei das Anhalten des 
Stabes in Kreisbögen gleiche’ Länge, unabhängig von ihrer Lage, betrachtet. 
Die Verschiedenheit der Definition der Wahrscheinlichkeit in der ersten und 
in der zweiten Lösung wird danach völlig klar. Die Wahrscheinlichkeit dafür, 
daß der Stab im Intervall von A bis x zur Ruhe kommt, ist nach der ersten 


Lösung gleich 5: Bei der zweiten Lösung ist die Wahrscheinlichkeit dafür, 


daß die Projektion des anderen Schnittpunktes des Stabes mit dem Kreis in 
das gleiche Intervall fällt, wie elementare geometrische Überlegungen zeigen, 
gleich 

D—2z 


4 = 
— art cos für z< a 
n 2 


und 
—D 


1 2x 
1-— —.arc cos 
E74 


Schließlich wird in der letzten Lösung auf gut Glück ein Punkt in das Innere 
des Kreises geworfen, und wir fragen nach der Wahrscheinlichkeit dafür, daß 
dieser Punkt in das Innere des kleineren konzentrischen Kreises fällt (Abb. 4c). 

Die Verschiedenheit der Aufgabenstellungen in allen drei Fällen ist völlig 
klar. 


Beispiel 3. Die Aufgabe von Burron. Auf der Ebene werden parallele 
Geraden gezogen, die voneinander den Abstand 2a haben. Auf die Ebene wird 
auf gut Glück!) eine Nadel der Länge 2 !(l < a) geworfen. Gesucht ist die Wahr- 
scheinlichkeit dafür, daß die Nadel irgendeine Gerade schneidet. 


Lösung. Wir bezeichnen mit x den Abstand des Mittelpunktes der Nadel 
von der nächsten Geraden und mit @ den Winkel zwischen der Nadel und 
dieser Geraden. Die Größen x und p bestimmen die Lage der Nadel vollständig. 
Alle möglichen Lagen der Nadel sind durch die Punkte eines Rechtecks mit 
den Seiten a und x bestimmt. Aus Abb. 5 geht hervor, daß die Nadel dann 
und nur dann eine Parallele schneidet, wenn 


xz<Isinp 


ist. Die gesuchte Wahrscheinlichkeit ist unter unseren Voraussetzungen gleich 
dem Verhältnis des in Abb. 6 schraffierten Gebietes zum Flächeninhalt des 
ganzen Rechtecks " 
p=— [linpap=.. 
an a 
ö 


n 


1) Unter dem Ausdruck „auf gut Glück“ ist hier folgendes zu verstehen: Erstens fällt der 
Mittelpunkt der Nadel auf gut Glück in ein Intervall zwischen zwei Geraden, zweitens 
ist die Wahrscheinlichkeit dafür, daß der Winkel p zwischen der Nadel und einer Ge- 
raden zwischen 9, und g, + A liegt, proportional Ap und drittens sind die Größen x 
und 9 unabhängig (s. $ 9). 
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Die Aufgabe von Burrox ist Ausgangspunkt für die Lösung einiger Probleme 
der Ballistik, die die Größe der Geschosse berücksichtigen. 

Beispiel 4. Auf einer horizontalen Ebene werden im Abstand 2a Par- 
allelen gezogen und auf die Ebene werde auf gut Glück!) eine konvexe Kontur 
geworfen, deren Durchmesser kleiner als 2a ist. Gesucht ist die Wahrschein- 
lichkeit dafür, daß die Kontur eine der parallelen Geraden schneidet. 


2a 


Abb. 5 


Abb. 6 


Lösung. Wir nehmen zunächst an, daß die konvexe Kontur ein Vieleck 
mit rn Seiten ist. Seine Seiten seien numeriert von 1 bis n. Wenn das Vieleck 
eine parallele Gerade schneidet, so muß an zwei Seiten ein Schnitt vorliegen. 
Wir bezeichnen mit p;; = p;; die Wahrscheinlichkeit dafür, daß der Schnitt an 
der i-ten und j-ten Seite erfolgt. Offenbar kann das Ereignis A, das darin 
besteht, daß das Vieleck eine der parallelen Geraden schneidet, folgender- 
maßen als Summe paarweise unvereinbarer Ereignisse dargestellt werden: 


A= (Ag + Ast + Am) + AR tAu rt t+AN) + 


+ (An o,nı + Aua,n) + Anoı,a- 


1) In diesem Beispiel bedeutet „auf gut Glück“, daß wir irgendein mit der Kontur fest, 
verbundenes Intervall nehmen und es auf gut Glück im Sinne des vorigen Beispiels werfen. 

Man sieht leicht, daß der so bestimmte Begriff des Ausdrucks „auf gut Glück‘ nicht 
von der Wahl des Intervalls abhängt. 
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Hier bezeichnet A,(i<j, i=1,2,...,n) das Ereignis, daß die i-te und die 
j-te Seite eine parallele Gerade schneidet. Nach dem Additionstheorem der 
Wahrscheinlichkeiten ist 


p = P(A) = Pf[(A,) + PA) + + P(Aım] 
+ [P(A,) + + P(A,„)] + Ze + P(A,- ı,n) 
=(PatPa +" +P)+PatPat "+ Pan)+t "+ Pa-ın 


Wenn wir die Gleichung p;; = pj; benutzen, können wir die Wahrscheinlich- 
keit p auch noch anders schreiben: 


P=z [Pia + Ps + + Pd + Pa + Pan + + Pan) + 
+ (Prı + Pna ++ Pr,n—ı)] * 


n 
Die Summe Z’ p;; mit p« = 0 ist nichts anderes als die Wahrscheinlichkeit 
jel 


dafür, daß die i-te Seite des Vielecks eine der parallelen Geraden schneidet. 
Bezeichnet man die Länge der i-ten Seite mit 2/;, so findet man aus der 
Burroxschen Aufgabe 


Mu) _2 
ER der ’ 
also ist 
Rn 
221; 
_i-l 
er 2na 


Bezeichnet man mit 2s den Umfang des Vielecks, so findet man schließlich 
2 8 
ar 
Wir sehen also, daß die Wahrscheinlichkeit p weder von der Anzahl der 
Seiten noch von der Länge der Seiten des Vielecks abhängt. Hieraus schließen 
wir, daß die gefundene Formel auch für eine beliebige konvexe Kontur gültig 


ist, da wir sie stets als Grenzkurve einer Folge konvexer Vielecke mit unbe- 
schränkt wachsender Anzahl von Seiten betrachten können. 
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Beim Übergang von den einfachen Beispielen zur Betrachtung komplizierter 
Aufgaben, insbesondere solcher von naturwissenschaftlichem oder technischem 
Charakter, stößt die klassische Definition der Wahrscheinlichkeit auf unüber- 
windliche Schwierigkeiten, die prinzipieller Natur sind. Vor allem erhebt sich 
in der Mehrzahl der Fälle die Frage, ob es möglich ist, in vernünftiger Weise 
die gleichmöglichen Fälle herauszufinden. So ist es z.B. heute zumindest 
ziemlich schwierig, auf Grund von Symmetrieüberlegungen, auf denen unsere 
Aussagen über die Gleichwahrscheinlichkeit von Ereignissen beruhen, die 
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Wahrscheinlichkeit des Zerfalls eines Atoms einer radioaktiven Substanz wäh- 
rend eines bestimmten Zeitintervalls abzuleiten oder die Wahrscheinlichkeit 
dafür zu bestimmen, daß ein Kind, das geboren werden soll, ein Knabe ist. 


Lange Beobachtungen über das Auftreten oder Nichtauftreten eines Er- 
eignisses A bei einer großen Anzahl wiederholter Versuche bei unverändertem 
Bedingungskomplex © zeigen, daß für einen großen Kreis von Erscheinungen 
die Anzahl des Eintretens des Ereignisses A bestimmten Gesetzmäßigkeiten 
unterworfen ist. Bezeichnen wir nämlich mit # die Anzahl des Eintretens des 
Ereignisses A in n unabhängigen Versuchen, so zeigt es sich, daß das Verhält- 


nis ” bei genügend großem n in der Mehrzahl solcher Beobachtungsserien 


einen fast konstanten Wert annimmt, wobei größere Abweichungen desto 
seltener beobachtet werden, je mehr Versuche ausgeführt werden. 


Eine derartige Stabilität der relativen Häufigkeiten (d. h. der Quotienten 
=) stellte man zuerst in Erscheinungen der Bevölkerungsstatistik fest. So 


bemerkte man schon sehr früh, daß für ganze Staaten und für große Städte 
das Verhältnis der Anzahl der Knabengeburten zur Anzahl aller Geburten 
von Jahr zu Jahr fast konstant bleibt. Im alten China berechnete man es 


2238 Jahre vor unserer Zeitrechnung auf Grund von Aufzeichnungen zu 7: 


Später erschienen besonders im 17. und 18. Jh. eine Reihe grundlegender 
Arbeiten, die die Untersuchung der Bevölkerungsstatistik zum Ziel hatten. 
Es stellte sich heraus, daß es neben der Stabilität des Verhältnisses der Knaben- 
geburten noch weitere stabile Erscheinungen gibt, z.B. den Prozentsatz 
der Sterblichkeit in einem bestimmten Alter für bestimmte Bevölkerungs- 
gruppen (unter bestimmten materiellen und sozialen Bedingungen), die Ver- 
teilung von Personen (bestimmten Geschlechts, Alters und bestimmter Natio- 
nalität) der Größe nach, dem Brustumfang nach, der Rückenlänge nach usw. 


In seinem bekannten Buch „Versuch einer Philosophie der Wahrscheinlich- 
keitsrechnung‘ erzählt LAPLAcE von einer sehr bemerkenswerten Episode, die 
er bei der Untersuchung der Gesetzmäßigkeit der Geburt von Knaben und 
Mädchen erlebte. Umfassendes statistisches Material, das von ihm untersucht 
wurde, ergab für London, Petersburg, Berlin und ganz Frankreich fast genau 
übereinstimmende Verhältnisse der Knabengeburten zur Anzahl aller Geburten. 
Alle diese Verhältnisse schwankten in einem Zeitraum von 10 Jahren um ein 


und dieselbe Zahl, die ungefähr gleich z ist. Doch führten zur gleichen 
Zeit die Untersuchungen des statistischen Materials der Stadt Paris für einen 
Zeitraum von 40 Jahren (von 1745—1784) zu einer anderen Zahl 2 . LAPLACE 


interessierte sich natürlich dafür, woher dieser merkliche Unterschied kam 
und versuchte, ihn vernünftig zu erklären. Bei einer genaueren Untersuchung 
des Archivmaterials zeigte es sich, daß in die Anzahl der Geburten in Paris 
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auch alle Findelkinder eingeschlossen waren. Es zeigte sich ferner, daß die 
Bevölkerung der Pariser Umgebung es vorzog, hauptsächlich Knaben auszu- 
setzen. Diese Erscheinung sozialer Natur war damals so verbreitet, daß sie 
das wahre Bild der Geburtenzahl in Paris wesentlich beeinflußte. Als LArLAcE 
die Findelkinder aus der Anzahl der Geburten ausschloß, zeigte es sich, daß 
auch für Paris das Verhältnis der Anzahl der Knabengeburten zur Anzahl aller 


Geburten stabil war und gleichfalls nahe an der Zahl 2 lag, so wie es für die 


anderen Völker und für Frankreich im ganzen der Fall war. 

Zur Zeit von LAPLACE war ein sehr umfangreiches statistisches Material 
gesammelt worden, das es gestattete, im voraus gesellschaftlich wichtige 
bevölkerungsstatistische Erscheinungen zu berechnen. 

Als abschließende Hlustration statistischer Gesetzmäßigkeiten bringen wir 
eine Tabelle neuerer Daten, aus der man ersehen kann, wie bei einer größeren 


Tabelle 3 


6957 | 7883 
u. a 944 | 3964 

3711 | 3775 | 3665 | 3621 | 35906 
0,489 | 0,490 | 0,471 | 0,478 | 0,482 | 0,462 | 0,484 


Anzahl von Fällen die Verteilung der Neugeborenen auf die beiden Geschlechter 
in jedem Monat fast konstant ist. Die Daten stammen aus dem Buch von 
H. CRAm£R „Mathematische Methoden der Statistik“ und sind die offiziellen 
Daten der schwedischen Statistik vom Jahre 1935. 


Abb. 7 


In Abb. 7 kann man das Abweichen der relativen Häufigkeit der Mädchen- 
geburten in den einzelnen Monaten von der relativen Häufigkeit für das ganze 
Jahr feststellen. 


4 Gnedenko 
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Man sieht also, daß für solche Fälle, auf die die klassische Definition der 
Wahrscheinlichkeit anwendbar ist, die relative Häufigkeit um die Wahrschein- 
lichkeit p des Ereignisses schwankt. 

Man besitzt ein umfangreiches Erfahrungsmaterial zur Bestätigung dieser 
Tatsache. So wurden z.B. Münzen geworfen, so spielte man mit Würfeln, 
warf Nadeln zur empirischen Bestimmung der Zahl x (s. Beispiel 3, $ 6) und 
anderes mehr. Wir bringen hier einige der gewonnenen Resultate, beschränken 
uns jedoch auf die Experimente des Wurfs einer Münze [siehe Tabelle unten]. 

Heutzutage gibt es andere Beispiele, an denen man diese empirische 
Tatsache nachprüft, der eine so wichtige wissenschaftliche und praktische 
Bedeutung zukommt. So besitzt in der modernen statistischen Praxis ”die 


Tabelle 3 


Anzahl des 


Anzahl der | Auftretens des relative 
Würfe Ereignisses Häufigkeit 
„Kopf“ 
rare 2048 0,5080 
6019 0,5016 
12012 0,5005 


Tabelle der zufälligen Zahlen eine große Bedeutung, in der jede Ziffer auf gut 
Glück aus der Gesamtheit der Ziffern 0, 1, 2, ... , 9 herausgegriffen wurde. In 
einer dieser Tabellen zufälliger Zahlen kommt unter den ersten 10000 zufälligen 
Zahlen die Ziffer 7 gerade 968 mal vor, d.h. ihre relative Häufigkeit ist gleich 
0,0968 (die Wahrscheinlichkeit des Auftretens der Ziffer 7 ist aber gleich 0,1). 
Zählt man das Auftreten der Ziffer 7 in den Serien zu je 1000 aufeinander- 
folgenden zufälligen Zahlen, so erhält man folgende Tabelle: 


Tausender ......... 1 2 3 4 5 6 7 8 9 10 
Anzahl der vor- 

kommenden Ziffen7 ... 9 88 95 112 95 99 82 89 111 102 
rel, Häufigkeit... . .. . 0,095 0,088: 0,095 0,112 0,095 0,099 0,082 0,089 0,111 0,102 


Die relativen Häufigkeiten des Auftretens einer 7 in den verschiedenen 
Gruppen von je 1000 Zahlen schwanken ziemlich stark. Doch liegen sie alle 
verhältnismäßig nahe an der Wahrscheinlichkeit. 

Daß bei einer großen Anzahl von Versuchen für eine Reihe zufälliger Er- 
eignisse die relative Häufigkeit fast konstant bleibt, zwingt uns zu der An- 
nahme, daß vom Beobachter unabhängige Gesetzmäßigkeiten im Ablauf der 
Erscheinungen wirksam sind, die sich gerade in der Stabilität der relativen 
Häufigkeiten äußern. Da für Ereignisse, auf die die klassische Definition der 
Wahrscheinlichkeit anwendbar ist, die relative Häufigkeit der Ereignisse bei 
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einer großen Anzahl von Versuchen in der Regel nahe der Wahrscheinlichkeit 
liegt, müssen wir auch im allgemeinen Falle annehmen, daß eine gewisse 
Konstante existiert, in deren Nähe die relative Häufigkeit bleibt. Diese Kon- 
stante, die zahlenmäßig die Erscheinung objektiv charakterisiert, nennt man 
naturgemäß die Wahrscheinlichkeit des untersuchten zufälligen Ereignisses A. 

Wir sagen also, ein Ereignis A besitzt eine Wahrscheinlichkeit, wenn dieses 
Ereignis folgende Besonderheiten besitzt: 


a) Man kann zumindest prinzipiell bei ungeänderten Bedingungen © unbe- 
grenzt viele voneinander unabhängige Versuche ausführen, in denen es Er- 
eignis A eintreten kann oder nicht. 


b) Nach genügend vielen Versuchen wird festgestellt, daß die relative Häufig- 
keit des Ereignisses A für fast jede größere Gruppe von Beobachtungen nur 


unwesentlich von einer gewissen (im allgemeinen unbekannten) Konstanten 
abweicht. 


Als Zahlenwert dieser Wahrscheinlichkeit kann man bei einer großen Anzahl 
von Versuchen angenähert die relative Häufigkeit des Ereignisses A oder eine 
dieser Frequenz recht nahe Zahl nehmen. Die so bestimmte Wahrscheinlichkeit 
eines zufälligen Ereignisses heißt die statistische Wahrscheinlichkeit. Natur- 
gemäß muß man im Falle der statistischen Definition von der Wahrschein- 
lichkeit die folgenden Eigenschaften fordern: 


1. Die Wahrscheinlichkeit des sicheren Ereignisses ist gleich Eins; 
2. die Wahrscheinlichkeit des unmöglichen Ereignisses ist gleich Null; 


3. wenn ein zufälliges Ereignis C die Summe endlich vieler unvereinbarer 
Ereignisse A, Ag ..., A, ist, die alle eine Wahrscheinlichkeit besitzen, so 
existiert auch die Wahrscheinlichkeit von C und ist gleich der Summe der 
Wahrscheinlichkeiten der Teilereignisse 


P(C) = P(A,) + P(A) + + P(A„)- 


Diese statistische Definition der Wahrscheinlichkeit trägt eher einen be- 
schreibenden als einen formal mathematischen Charakter. Man muß noch 
darauf hinweisen, daß sie auch von einem anderen Standpunkt aus unzu- 
reichend ist: Sie geht nicht darauf ein, weshalb bei diesen Erscheinungen die 
relativen Häufigkeiten stabil sind. Damit wollen wir hervorheben, daß in dieser 
Richtung noch einige Untersuchungen durchgeführt werden müssen. Es ist 
jedoch besonders wichtig, daß bei unserer Definition die Wahrscheinlichkeit 
eine objektive, vom erkennenden Subjekt unabhängige Bedeutung besitzt. 
Daß wir erst nach einigen Beobachtungen etwas darüber aussagen können, ob 
das eine oder das andere Ereignis eine Wahrscheinlichkeit besitzt, entwertet 
unsere Überlegungen keineswegs, da das Erkennen von Gesetzmäßigkeiten 
niemals aus dem Nichts heraus erfolgen kann, ihm geht stets ein Experiment, 
eine Beobachtung voraus. Die Gesetzmäßigkeiten selbst existierten jedoch 
4*r 
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schon, bevor eine experimentierende und denkende Person eingriff, sie waren 
nur der Wissenschaft noch unbekannt. 


Wir sagten bereits, daß wir hier keine formal-mathematische Definition 
der Wahrscheinlichkeit angeben wollen, wir haben nur unter gewissen Be- 
dingungen ihre Existenz postuliert und eine Methode angegeben, "wie sie sich 
approximativ abschätzen läßt. Jede objektive Eigenschaft einer zu unter- 
suchenden Erscheinung, darunter auch die Wahrscheinlichkeit des Ereignisses A, 
ist ausschließlich durch die Struktur dieser Erscheinung bestimmt, unabhängig 
davon, ob ein Experiment ausgeführt wird oder nicht, ob ein experimen- 
tierender Intellekt zugegen ist oder nicht. Dennoch haben wir dem Experi- 
ment eine wesentliche Bedeutung beigemessen. Erstens gestattet es das 
Experiment, in der Natur wirkende wahrscheinlichkeitstheoretische Gesetz- 
mäßigkeiten aufzudecken, zweitens kann man mit seiner Hilfe approximativ 
die unbekannten Wahrscheinlichkeiten der von uns untersuchten Ereignisse 
bestimmen, und schließlich bietet es die Möglichkeit, die Richtigkeit einiger 
theoretischen Annahmen nachzuprüfen, die wir bei unseren Untersuchungen 
machen. Dies wollen wir noch etwas erklären. Stellen wir uns vor, daß einige 
Überlegungen es nahelegen anzunehmen, daß die Wahrscheinlichkeit eines Er- 
eignisses A gleich p sei. Ferner zeige es sich bei der Durchführung einiger 
Serien unabhängiger Versuche, daß die relative Häufigkeit in der Mehrzahl 
der Serien wesentlich von der Größe p abweicht. Dieser Tatbestand läßt natür- 
lich Zweifel an der Richtigkeit unserer apriorischen Überlegungen aufkommen 
und erfordert eine eingehendere Untersuchung der Voraussetzungen, von denen 
wir ausgegangen waren. So machen wir z.B. bei einem Würfel die Voraus- 
setzung, daß er geometrisch richtig gebaut und aus homogenem Material 
angefertigt ist. Aus diesen Voraussetzungen können wir mit Recht schließen, 
daß bei einem Wurf die Wahrscheinlichkeit des Auftretens einer bestimmten 


Fläche, z. B. der Fläche mit der Ziffer 5, gleich + sein muß. Wenn sich jedoch 
in mehrfachen Serien von genügend vielen Versuchen (Würfen) systematisch 
zeigt, daß die Frequenz des Auftretens dieser Fläche merklich von abweicht, 


so zweifeln wir nicht an der Existenz einer bestimmten Wahrscheinlichkeit 
für das Auftreten dieser Fläche, sondern an unseren Voraussetzungen über 
die Richtigkeit des Würfels oder daran, daß unsere Versuche richtig durch- 
geführt wurden. 


Zum Schluß müssen wir noch auf die besonders unter den Naturwissen- 
schaftlern sehr verbreitete Auffassung der Wahrscheinlichkeit von R. v. Mıszs 
eingehen. Da die relative Häufigkeit mit immer größer werdender Anzahl der 
Versuche immer weniger von der Wahrscheinlichkeit p abweicht, muß nach 
v. MISES 
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sein. v. Mıses schlägt vor, diese Gleichung als Definition des Begriffes der Wahr- 
scheinlichkeit zu verwenden. Nach seiner Meinung ist jede apriorische De- 
finition zum Scheitern verurteilt und nur die von ihm angegebene empirische 
Definition geeignet, den Interessen der Naturwissenschaft, der Mathematik 
und der Philosophie gerecht zu werden. Da die klassische Definition nur eine 
beschränkte Anwendung besitzt, die statistische Definition aber auf alle Fälle, 
die überhaupt ein wissenschaftliches Interesse verdienen, anwendbar ist, schlägt 
v. Mıszs vor, die klassische Definition mit Hilfe der auf der Symmetrie be- 
ruhenden Gleichmöglichkeit gänzlich fallen zu lassen. Darüber hinaus hält 
es v. Mıses überhaupt für unnötig, die Struktur der Erscheinungen zu erklären, 
für die-die Wahrscheinlichkeit eine objektive charakteristische Größe ist; ihm 
genügt die Existenz einer empirischen Stabilität der relativen Häufigkeit. 
Die v. Miszssche Theorie geht von einer unendlichen Folge von Versuchsergeb- 
nissen aus, einem sog. Kollektiv. Jedes Kollektiv mnß die folgenden zwei Eigen- 
schaften besitzen. 


1. Existenz der Grenzwerte der relativen Häufigkeit jener Beobachtungen, bei 
denen irgendein Merkmal A aufgetreten ist, d. h., ist unter den n ersten Beob- 


achtungen n,-mal das Merkmal A erschienen, so soll lim MA existieren. 
>00 


2. Regellosigkeit, d. h. die Bildung des entsprechenden Grenzüberganges inner- 
halb einer Teilfolge, die durch ‚‚Stellenauswahl‘“ aus der Gesamtfolge gewonnen 
worden ist, führt zum selben Limes; Stellenauswahl ist eine Vorschrift, durch 
die über die Zugehörigkeit der n-ten Beobachtung zur Teilfolge unabhängig 
vom Ergebnis dieser n-ten Beobachtung entschieden wird. 

Der Aufbau einer mathematischen Theorie, die sich auf diese beiden Forde- 
rungen gründet, stieß auf unüberwindliche logische Schwierigkeiten. Die Eigen- 
schaft der Regellosigkeit erwies sich nämlich als unvereinbar mit der Forderung 
nach Existenz der Limites. 

Wir wollen nicht auf Einzelheiten der v. Mısesschen Theorie eingehen. Für 
die Einzelheiten seiner Theorie verweisen wir den Leser auf das v. Misessche 
Buch „Wahrscheinlichkeit, Statistik und Wahrheit‘‘ und für eine eingehendere 
Kritik auf einen Artikel von A. J. Camtscrin!). Wir beschränken uns hier 
nur auf einige Bemerkungen, die dem Leser zeigen sollen, daß die v. Mıszssche 
Konzeption unannehmbar ist. 

Die von v. Mıses entwickelten Ansichten fanden eifrige Anhänger, besonders 
unter den Vertretern der Naturwissenschaften, hauptsächlich dank der über- 
zeugenden Kritik von v. Mıszs an der Enge und Beschränktheit der klassischen 
Begriffe und der Hinzunahme der Erfahrung bei der Definition der Wahr- 
scheinlichkeit. Auf Grund der vernichtenden Kritik, die W. I. Lenin an ver- 
schiedenen Richtungen des Idealismus in seinem unsterblichen Buch „Materia- 
lismus und Empiriokritizismus‘ übte, wissen wir aber, daß nicht jeder Gelehrte, 


1) Die v. Miszssche Lehre über die Wahrscheinlichkeit und die Prinzipien der physi- 
kalischen Statistik. Uspechi fiz. Nauk 9 (2), (1929). 
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der davon spricht, daß er seine Theorie auf die Erfahrung stützt, wirklich 
eine materialistische Theorie aufbaut. So stand es auch mit v. Mıszs, seine 
prinzipielle Einstellung harmonierte völlig mit der MAc#schen Philosophie; 
v. Mises selbst verheimlichte dies gar nicht, sondern erklärte dies ganz offen. 

In der v. Mıszsschen Konzeption verliert die Wahrscheinlichkeit ihre Eigenart 
als eine objektive zahlenmäßige Charakteristik gewisser realer Erscheinungen. 
In der Tat kann man, bevor nicht unendlich viele Versuche ausgeführt wurden, 
nach v. Mıses nicht einmal von der Wahrscheinlichkeit des einen oder des ande- 
ren Ereignisses sprechen. Da man unendlich viele Versuche aber niemals durch- 
führen kann, hat man überhaupt keine Möglichkeit, unter irgendwelchen Be- 
dingungen die Wahrscheinlichkeitsrechnung zu benutzen. Dabei muß man be- 
merken, daß Mıszs, wenn er die Konvergenz der relativen Häufigkeiten gegen 
die Wahrscheinlichkeit fordert, eine Forderung stellt, die auf keinem Gebiet 
der Naturwissenschaft sonst noch auftritt. So wird doch z.B. niemand den 
Begriff der Temperatur nur aus dem Grunde ablehnen, weil wir nicht unendlich 
viele Messungen ausführen und nicht nachprüfen können, ob die Resultate 
dieser Messungen gegen einen Grenzwert streben, falls wir sie tatsächlich aus- 
führen könnten. Ebenfalls werden wir doch nicht davon sprechen, daß irgend- 
ein Gegenstand keinen Umfang besitzt, nur aus dem Grunde, weil die Folge 
unserer Messungen nicht gegen einen Grenzwert strebt. Nach v. Mıses könnten 
wir überhaupt nicht von der Temperatur oder dem Umfange eines Gegenstandes 
sprechen, solange nicht ein denkendes Subjekt zugegen ist, solange keine Mes- 
sungen ausgeführt werden und man sich davon überzeugt hat, daß ihre Er- 
gebnisse gegen einen Grenzwert streben. 


88. Axiomatischer Aufbau der Wahrscheinlichkeitsrechnung 


Vor nicht allzulanger Zeit war die Wahrscheinlichkeitsrechnung noch keine 
ausgeprägt mathematische Wissenschaft; in ihr waren die Grundbegriffe noch 
sehr ungenau definiert. Diese Ungenauigkeit führte nicht selten zu paradoxen 
Schlüssen (wir erinnern an das Berrranpsche Paradoxon). Es ist natürlich, 
daß die Anwendungen der Wahrscheinlichkeitsrechnung auf das Studium der 
Naturerscheinungen schwach begründet waren und häufig auf eine scharfe 
und berechtigte Kritik stießen. Man muß jedoch feststellen, daß dies die 
Naturforscher kaum hinderte und daß ihre naiven wahrscheinlichkeitstheore- 
tischen Verfahrensweisen auf verschiedenen Gebieten der Wissenschaft zu 
beachtlichen Erfolgen führten. Die Entwicklung der Naturwissenschaft zu 
Beginn dieses Jahrhunderts stellte an die Wahrscheinlichkeitsrechnung erhöhte 
Anforderungen. Es wurde notwendig, systematisch die Grundbegriffe der 
Wahrscheinlichkeitsrechnung zu untersuchen und die Bedingungen heraus- 
zustellen, unter denen ihre Resultate anwendbar sind. Eine besondere Be- 
deutung gewann hierbei die formal-logische Begründung der Wahrscheinlich- 
keitsrechnung, ihr axiomatischer Aufbau. Hierbei müssen der Wahrscheinlich- 
keitsrechnung als einer mathematischen Wissenschaft gewisse Voraussetzungen 
zugrunde gelegt werden, die eine Verallgemeinerung jahrhundertealter mensch- 
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lichen Erfahrungen darstellen. Der weitere Aufbau der Theorie vollzieht sich 
dann vermittels Folgerungen aus diesen Grundannahmen ohne Bezugnahme 
auf anschauliche Vorstellungen, auf sog. Schlüsse „nach dem gesunden Men- 
schenverstand“. Mit anderen Worten, die Wahrscheinlichkeitsrechnung 
muß ebenso auf Axiome aufgebaut werden, wie jede beliebige andere mathe- 
matische Disziplin — die Geometrie, die theoretische Mechanik, die Gruppen- 
theorie usw. 

Dieser Gedanke wurde zum ersten Male im Jahre 1917 von dem sowjetischen 
Mathematiker S. N. BERNSTEIN ausgesprochen und weiterentwickelt. S. N. 
BERNSTEIN ging dabei von einem qualitativen Vergleich der zufälligen Er- 
eignisse nach ihrer größeren oder kleineren Wahrscheinlichkeit aus. 

Es gibt noch eine andere Art der Behandlung dieser Frage, die von A. N. 
KoLMmoGororF vorgeschlagen wurde. Sie verknüpft die Wahrscheinlichkeits- 
rechnung mit der modernen metrischen Funktionentheorie sowie mit der Mengen- 
lehre. Unser Buch folgt dem von KoLmocororr eingeschlagenen Weg. 

Wir werden sehen, daß der axiomatische Aufbau der Grundlagen der Wahr- 
scheinlichkeitsrechnung von den Haupteigenschaften der Wahrscheinlichkeit 
ausgeht, die wir am Beispiel der klassischen und statistischen Definition 
kennenlernten. Die axiomatische Definition der Wahrscheinlichkeit schließt 
somit als Spezialfall sowohl die klassische als auch die stastistische Definition 
ein und vermeidet die Mängel jeder dieser Definitionen. Auf dieser Grundlage 
gelang es, ein logisch einwandfreies Gebäude der modernen Wahrscheinlich- 
keitsrechnung zu errichten und gleichzeitig den erhöhten Anforderungen der 
modernen Naturwissenschaft zu genügen. 

In der Axiomatik der Wahrscheinlichkeitsrechnung von KoOLMoGOROFF ist der 
Begriff des zufälligen Ereignisses kein Grundbegriff, sondern er wird aus ele- 
mentareren Begriffen aufgebaut. Einer solchen Betrachtungsweise begegneten 
wir bereits bei der Behandlung einiger Beispiele. So wird in den Aufgaben zur 
geometrischen Definition der Wahrscheinlichkeit ein Gebiet G des Raumes 
(der Geraden, der Ebene usw.) betrachtet, in das auf gut Glück ein Punkt 
geworfen wird. Die zufälligen Ereignisse bestehen dabei darin, daß der Punkt in 
das eine oder andere Teilgebiet von G fällt. Jedes zufällige Ereignis erscheint als 
eine Teilmenge der Menge G. Dieser Gedanke liegt der allgemeinen Auffassung 
eines zufälligen Ereignisses in der Axiomatik von A. N. KoLMoGoRoFF zugrunde. 

KoLMOGoROFF geht von einer Menge U von elementaren Ereignissen aus. 
Was die Elemente dieser Menge darstellen, ist für die logische Entwicklung 
der Wahrscheinlichkeitsrechnung ganz gleichgültig. Ferner betrachtet er ein 
gewisses System F von Teilmengen der Menge U; die Elemente des Systems F 
heißen zufällige Ereignisse. Bezüglich der Struktur des Systems F werden die 
drei folgenden Bedingungen als erfüllt vorausgesetzt: 


1. F enthält als Element die Menge U. 


2. Sind A und B Teilmengen der Menge U und gleichzeitig Elemente von 
F, so enthält F auch die Mengen A + B, AB, A und B als Elemente. 
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Dabei verstehen wir unter A + B eine Menge, die sich aus denjenigen 
Elementen von U zusammensetzt, die entweder in A oder in B oder in A und 
B liegen; unter AB verstehen wir die Menge von Elementen aus U, die sowohl 
in A als auch in B liegen; schließlich bezeichnet A (bzw. B) die Menge der 
Elemente von U, die nicht in A (in B) liegen. 

Da F die ganze Menge U als Element enthält, so liegt in F nach der zweiten 
Bedingung auch U, d.h., F enthält die leere Menge als Element. 

Man sieht leicht ein, daß aus der zweiten Forderung folgt, daß zu F die 
Summe, das Produkt und die Komplemente endlich vieler Ereignisse aus F 
gehören. Auf diese Weise können die elementaren Operationen mit zufälligen 
Ereignissen nicht aus der Menge der zufälligen Ereignisse hinausführen. Wie 
in $3 nennen wir das System der Ereignisse F ein Ereignisfeld. 

Bei vielen wichtigen Problemen müssen wir vom Ereignisfeld noch mehr 
verlangen, und zwar 

3. sind die Teilmengen A, Ay ...; Ay... der Menge U Elemente von F, 
sosind auch ihre Summe A, + Ag+ + 4,4 - und ihr Produkt A,As*-: 
A,» Elemente von F. 

Die auf die eben beschriebene Weise gebildete Menge F nennt man ein 
Boreısches Ereignisfeld.t) 

Die soeben dargelegte Methode der Definition eines zufälligen Ereignisses 
entspricht vollkommen der Auffassung, die wir bei der Betrachtung konkreter 
Beispiele gewonnen hatten. Der größeren Klarheit halber betrachten wir unter 
diesem Gesichtspunkt zwei Beispiele etwas genauer. 


Beispiel 1. Es werde ein Würfel geworfen. Die Menge U der elemen- 
taren Ereignisse besteht aus den 6 Elementen E,, E, Ey, E, Es, Ey Eı bezeich- 
net hier das Auftreten von i Augen. Die Menge F. der zufälligen Ereignisse 
besteht aus folgenden 2° = 64 Elementen: (V), (E,), (E,), (E3), (E,) (E,); (E.): 
(E,E,), (Eu Ed) - - -, (Eu Eu), (Er Eu Ea); - - - » (Ey Ey Ed; (Ei En Es» Ed)» - - - ; 
(E,, E, Es Eı), (Eı Ey E, E, Es), ae | Es, Ey E, Ey Es) (E» Es, E, Ey» Ey Es). 

Jede Klammer deutet hier an, aus welchen Elementen der Menge U die 
Teilmenge besteht, die als Element in F auftritt; mit dem Symbol (V) be- 
zeichneten wir die leere Menge. 


Beispiel2. Die Aufgabe über die Begegnung. Die Menge U besteht 
aus den Punkten des Quadrats 0 <2<60,0<y<60. 

Die Menge F besteht aus allen Borztschen Mengen, die aus Punkten dieses 
Quadrats gebildet werden. Insbesondere liegt in F die Menge der Punkte des 
abgeschlossenen Gebiets !v— y| <20 und stellt demnach ein zufälliges Er- 
eignis dar. 

Naturgemäß führen wir folgende Definitionen ein: 

Wenn zwei zufällige Ereignisse A und B keine gemeinsamen Elemente der 
Menge U besitzen, so nennen wir sie unvereinbar. 


2) An Stelle des Ausdrucks „Ereignisfeld‘‘ sagt man jetzt oft auch „Ereignisalgebra“. 
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Das zufällige Ereignis U heißt das sichere Ereignis, das zufällige Ereignis U 
(die leere Menge) das unmögliche Ereignis. Die Ereignisse A und A heißen 
einander entgegengesetzt. 

Wir können nun dazu übergehen, die Axiome zu formulieren, die die Wahr- 
scheinlichkeit definieren. 


Axiom 1. Jedem zufälligen Ereignis A aus dem Wahrscheinlichkeitsjeld F 
ist eine nichtnegative Zahl P(A) zugeordnet, die sog. Wahrscheinlichkeit von A. 


Axiom 2. P(U) = 1. 


Axiom 3 (Additionsaxiom). Wenn die Ereignisse A,, A,..., A, paar- 
weise unvereinbar sind, so ist 


PlAı + As ++ A) = PA) + PA) +++ Plan). 


Im Rahmen der klassischen Definition der Wahrscheinlichkeit brauchten 
wir die in den Axiomen 2 und 3 ausgedrückten Eigenschaften nicht zu postu- 
lieren, da wir dort diese Eigenschaften beweisen konnten. Die Behauptung des 
Axioms 1 ist aber in der klassischen Definition der Wahrscheinlichkeit selbst 
enthalten. 

Aus den formulierten Axiomen ziehen wir nun eine Reihe wichtiger elemen- 
tarer Folgerungen. 

Zunächst schließen wir aus der offensichtlichen Gleichung 


U=V+U 


P(U) = P(V) + P(U) 


und aus Axiom 3, daß 
ist. 
Es gilt also: 
1. Die Wahrscheinlichkeit des unmöglichen Ereignisses ist gleich Null. 
Ähnlich beweist man: 
2. Für ein beliebiges Ereignis A gilt 
P(A) = 1—P(A). 
Wie S. 21 folgt auch 
3. Für jedes zufällige Ereignis A gilt 
0<P(A)<1i. 
4. Wenn das Ereignis A das Ereignis B nach sich zieht, so ist 
P(A)<P(B). 
5. A und B seien zwei beliebige Ereignisse. Da in den Summen A+B 


=A-+(B— AB) und B=AB-+(B— AB) die Summanden unvereinbare 
Ereignisse sind, ist nach Axiom 3 


P(A+B)=P(A4)+P(B—AB); P(B)=P(AB) +P(B— AB). 
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Hieraus ergibt sich das Additionstheorem für beliebige Ereignisse A und B 
P(A + B) = P(A) + P(B)— P(AB). 
Da P(AB) nicht negativ ist, folgt unmittelbar 
P(A + B)<P(A) + P(B). 


Durch vollständige Induktion erhalten wir hieraus für beliebige Ereignisse 
Ay» Ag ..., A, die Ungleichung 


PfA,+A,+ +4} <P(A,) + P(A) ++ P(An). 


Das KormocororFsche Axiomensystem ist widerspruchsfrei, da es reale Ob- 
jekte gibt, die allen diesen Axiomen genügen. Wählt man z.B. für U eine 
beliebige endliche Menge mit einer endlichen Anzahl von Elementen U = {a,, 
Qy,...,@,} und für F die Gesamtheit aller Teilmengen {a;, , &g,-.-,Q}, 
1<u <u<...<i,<n,0<s<n, so kann man die KoLmogorovschen 
Axiome erfüllen, wenn man P(a)=p;(i=1,2,...,n)und P(a,, , %%-..,4;,) 
=Pı+tPia+t':'+P, Setzt. Hierbei sind die p; beliebige nichtnegative 


Zahlen, die nur der Bedingung $% p; = 1 unterwoıfen sind. 
i=1 


Das KorLmocoroFrsche Axiomensystem ist nicht vollständig: Sogar für ein 
und dieselbe Menge U können wir die Wahrscheinlichkeiten in der Menge F 
verschieden wählen. 

So können wir in dem betrachteten Beispiel mit dem Würfel entweder 

PIE)=P(E)=-- = PE)=z W) 
oder auch 
PE)=PEJ)=PE)=7, PE)=PE)=PE)=5 @ 
setzen USW. 

Die Unvollständigkeit des Axiomensystems der Wahrscheinlichkeitsrechnung 
liegt nicht an der unpassenden Wahl der Axiome oder an der ungenügenden 
Gedankenarbeit bei ihrer Ausarbeitung, sondern im Wesen der Sache: Bei 
verschiedenen Problemen können nämlich Erscheinungen auftreten, zu deren 
Studium man die gleichen Mengen von zufälligen Ereignissen zu betrachten 
hat, jedoch jedesmal mit verschiedenen Wahrscheinlichkeiten. Es können 
z. B. Würfel vorkommen, von denen der eine „richtig“ (mit homogener Dichte) 
und der andere „falsch‘ ist. Im ersten Falle wird die Wahrscheinlichkeit 
durch das System der Gleichungen (1), im zweiten etwa durch das System 
der Gleichungen (2) gegeben. 

Für den weiteren Aufbau der Wahrscheinlichkeitsrechnung braucht man 
noch eine weitere Voraussetzung, man fordert das Erfülltsein des sog. er- 
weiterten Additionsaxioms. Daß man notwendigerweise noch ein neues Axiom 
einführen muß, erklärt sich daraus, daß man es in der Wahrscheinlichkeits- 
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rechnung ständig mit Ereignissen zu tun hat, die in unendlich viele Teilereig- 
nisse zerfallen. 


Erweitertes Additionsaxiom. Wenn das Eintreten eines Ereignisses A 
gleichwertig damit ist, daß irgendeines der paarweise unvereinbaren Ereignisse 
A, Ay, Ay: .., A, .. . eintritt, so ist 


P(A) = PA) + PA) + + PAn+-:. 


Wir bemerken, daß das erweiterte Additionsaxiom durch das gleichwertige 
Stetigkeitsaxiom ersetzt werden kann. 


Stetigkeitsaxiom. Besitzt eine Folge von Ereignissen B,, By..., Ba; -:: 
die Eigenschaft, daß jedes folgende das vorhergehende nach sich zieht, und ist das 
Produkt aller Ereignisse B, das unmögliche Ereignis, so gilt 


P(B)>0 für now. 
Wir wollen die Äquivalenz der beiden Axiome beweisen. 


1. Aus dem erweiterten Additionsaxiom folgt das Stetigkeitsaxiom. Die 
Ereignisse B,, By - .., Bu - - . seien so gewählt, daß 


B>B>--->B,>--- 
und bei beliebigem n > 1 


IB =V (3) 
k>n 
ist. Offenbar ist 


B„=& BB; + II B;. 
ken » >n 


Da die in dieser Summe auftretenden Ereignisse paarweise miteinander unver- 
einbar sind, gilt nach dem erweiterten Additionsaxiom 


P(B,) = 5 P(B, BB.) + P( I B,). 
ken k>n 


Auf Grund von Bedingung (3) ist aber nun 


Pl IT Bı) =0, 
k>n 
und daher 


PB) — EP(Br Bir), 
d. h., P(B,) ist der Rest der konvergenten Reihe 
‚EP, Br) = P(B). 
Daher gilt P(B,) — 0 fürn— oo. 
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2. Aus dem Stetigkeitsaxiom folgt das erweiterte Additionsaxiom. Die 
Ereignisse A, Ag. . - , Ay, . . . seien paarweise unvereinbar, und es sei 


A=-A,+4ı+:+4A+. 
Wir setzen 
oo 
Bu 7 E23 Ar . 
k-n 
Offensichtlich ist B„+1ı < B„. Wenn das Ereignis B, eingetreten ist, so muß 
irgendein Ereignis A; ( > n) eingetreten sein. Wegen der Unvereinbarkeit der 
Ereignisse A; sind dann aber die Ereignisse A; ,, A;43, - . . Sicher nicht ein- 
getreten. Es ist dann also das Eintreten der Ereignisse B;, 1, Bjy+2,.- un- 


© 
möglich und folglich ist das Ereignis [7 B, unmöglich. Nach dem Stetigkeits- 
kun . 
axiom strebt also P(B,)—>0 fürn — oo. Da 


A=4A,+4A,+::-+4A, + Bar 
ist, folgt nach dem einfachen Additionsaxiom 


P(A) = P(A,) + PA) +++ P(A„) + P(Burn) 
= im IPA)= ZP(A). 


n>0 k=1 k 
Zum Schluß heben wir noch einmal hervor, daß vom Standpunkt der Mengen- 
lehre unsere axiomatische Definition der Wahrscheinlichkeit nichts anderes ist 
als die Einführung eines normierten, volladditiven nichtnegativen Maßes in 
der Menge U der elementaren Ereignisse, das für alle Elemente der Menge F 
definiert ist. 
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Wir sagten bereits, daß der Definition der Wahrscheinlichkeit eines Ereig- 
nisses eine gewisse Gesamtheit von Bedingungen © zugrunde liegt. Werden 
bei der Berechnung der Wahrscheinlichkeit P(A) außer den Bedingungen & 
keine weiteren Beschränkungen gemacht, so heißen diese Wahrscheinlichkeiten 
unbedingte Wahrscheinlichkeiten. 

In einer ganzen Reihe von Fällen aber ist die Wahrscheinlichkeit eines 
Ereignisses unter der zusätzlichen Voraussetzung zu bestimmen, daß ein 
Ereignis B mit einer positiven Wahrscheinlichkeit bereits eingetreten ist. Solche 
Wahrscheinlichkeiten nennen wir bedingle Wahrscheinlichkeiten und bezeich- 
nen sie mit P(A/B); dies soll also die Wahrscheinlichkeit des Ereignisses A 
unter der Bedingung bedeuten, daß das Ereignis B bereits eingetreten ist. 
Streng genommen sind die unbedingten Wahrscheinlichkeiten auch bedingte 
Wahrscheinlichkeiten, da der Ausgangspunkt des Aufbaues unserer Theorie 
die Voraussetzung der Existenz eines unveränderlichen Komplexes © von Be- 
dingungen war. 
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Beispiel 1. Es werden zwei Würfel geworfen. Wie groß ist die Wahr- 
scheinlichkeit dafür, daß die Summe der geworfenen Augen gleich 8 ist 
(Ereignis A), wenn bekannt ist, daß diese Summe eine gerade Zahl ist 
(Ereignis B)? 

Alle möglichen Fälle, die beim Wurf zweier Würfel auftreten, schreiben wir 
in der Tabelle 4 auf. Jedes Kästchen enthält ein mögliches Ereignis: An erster 
Stelle in der Klammer steht jeweils die Augenzahl des ersten Würfels, an 
zweiter Stelle die Augenzahl des zweiten. 


Tabelle 4 


(1,6) (3,0 | (46) 


Die Anzahl aller möglichen Fälle ist 36, die der für A günstigen 5. Die un- 
bedingte Wahrscheinlichkeit ist also gleich 


PA)=2. 


Wenn das Ereignis B eingetreten ist, muß sich eine von 18 (und nicht von 
36) Möglichkeiten verwirklicht haben. Die bedingte Wahrscheinlichkeit ist 
also gleich 


PAB=- 


Beispiel 2. Aus einem Kartenspiel werden nacheinander zwej Karten ge- 
zogen. Man bestimme a) die unbedingte Wahrscheinlichkeit dafür, daß die 
zweite Karte ein As ist (ohne daß man weiß, welche Karte zuerst gezogen 
wurde) und b) die bedingte Wahrscheinlichkeit dafür, daß die zweite Karte 
ein As ist, wenn zuvor ein As gezogen wurde. 

Wir bezeichnen mit A das Ereignis, daß an zweiter Stelle ein As auftritt, 
mit B das Ereignis, daß ein As an erster Stelle auftritt. Offensichtlich gilt 
die Gleichung 

A=AB-+AB. 


Auf Grund der Unvereinbarkeit der Ereignisse AB und AB haben wir 
P(A) = P(AB) + P(AB). 


Bei der Entnahme von zwei Karten aus einem Spiel von 36 Karten können 
36 - 35 Fälle eintreten (wenn man die Reihenfolge beachtet). Von ihnen sind 
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für das Ereignis AB 3. 4 Fälle, für das Ereignis AB 4 - 32 Fälle günstig. Also 
ergibt sich 


Wenn die erste Karte ein As ist, so bleiben im Spiel noch 35 Karten und 
unter diesen nur drei Asse. Folglich ist 


P(A/B) = = 


Es ist nicht schwer, für die klassische Definition der Wahrscheinlichkeit die 
allgemeine Aufgabe der Bestimmung einer bedingten Wahrscheinlichkeit zu 
lösen. Es seien z.B. von n allein möglichen, unvereinbaren und gleichwahr- 
scheinlichen Ereignissen A,, As, .. ., A, 


m Ereignisse günstig für das Ereignis A, 
k Ereignisse günstig für das Ereignis B, 
r Ereignisse günstig für das Ereignis AB 


(natürlich ist r <k,r <m). Wenn das Ereignis B eingetreten ist, so bedeutet 
dies, daß eines der Ereignisse A, eingetreten ist, die für B günstig sind. Unter 
dieser Bedingung sind für A diejenigen r und nur diese r Ereignisse A, günstig, 
die für AB günstig sind. Also ist 


ro 
n __P(4B) 
PBA)-= = a) 
n 
Ebenso kann man finden, daß 
= P(AB) F: 
P(B/A) = Pa) (1) 


ist. 

Ist A(B) ein unmögliches Ereignis, so verliert die Gleichung (1’) [bzw. (1)] 
ihren Sinn. 

Jede der Gleichungen (1), (1’) ist mit dem sog. Multiplikationsthrarem 
gleichwertig, gemäß dem 


P(AB) = P(A) P(BJA) = P(B) P(A/B) (2) 


ist, d. h., die Wahrscheinlichkeit des Produkts zweier Ereignisse ist gleich dem 
Produkt der Wahrscheinlichkeit des einen Ereignisses mit der bedingten Wahr- 
scheinlichkeit des anderen unter der Bedingung, daß das ersie eingetreten ist. 

Das Multiplikationstheorem ist auch in dem Falle anwendbar, wo eines der 
Ereignisse A oder B das unmögliche Ereignis ist, denn in diesem Falle gelten 
mit P(A) = 0 die Gleichungen P(A/B) = 0 und P(AB) = 0. 

Man nennt ein Ereignis A unabhängig von dem Ereignis B, wenn die Glei- 
chung 

P(A/B) = P(A) @) 
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besteht, d. h., wenn das Eintreten des Ereignisses B nicht die Wahrscheinlich- 
keit des Ereignisses A ändert. 
Wenn das Ereignis A unabhängig von B ist, so gilt nach (2) die Gleichung 


P(A) P(B/A) = P(B) P(A). 
Hieraus finden wir 
P(B/A) = P(B), (4) 


d. h., das Ereignis B ist auch unabhängig von A, d. h., die Unabhängigkeit von 
Ereignissen ist wechselseitig. 
Wenn die Ereignisse A und B unabhängig sind, sind auch die Ereignisse A 
und B unabhängig. Da nämlich 
P(B/A) + P(B/A) = 1 
und nach Voraussetzung P(B/A) = P(B) ist, so folgt 
P(B/A) =1— P(B) = P(B). 
Hieraus ziehen wir einen wichtigen Schluß: Wenn die Ereignisse A und B un- 
abhängig sind, so sind auch die in den Paaren (A, B), (A, B) und (A,B) ent- 
haltenen Ereignisse unabhängig. 

Der Begriff der Unabhängigkeit von Ereignissen spielt in der Wahrscheinlich- 
keitsrechnung und in ihren Anwendungen eine fundamentale Rolle. Insbe- 
sondere wird ein großer Teil der in diesem Buch abgeleiteten Resultate unter 
der Voraussetzung derUnabhängigkeit der einen oder der anderen betrachten- 
ten Ereignisse gewonnen. 

In praktischen Problemen greift man selten auf die Gleichungen (3) und (4) 
zurück, wenn man die Unabhängigkeit gegebener Ereignisse nachprüfen will. 
Gewöhnlich benutzt man dazu intuitive auf der Erfahrung beruhende Über- 
legungen. 

So ist z.B. klar, daß das Auftreten des Ereignisses „Kopf“ beim Wurf einer 
Münze die Wahrscheinlichkeit des Auftretens von „Kopf‘“ oder „Adler“ auf 
einer anderen Münze nicht beeinflußt, wenn diese Münzen nicht gerade während 
des Wurfes (etwa durch ein starres Verbindungsstück) miteinander gekoppelt 
sind. Ebenso ändert die Geburt eines Knaben bei einer Mutter nicht die 
Wahrscheinlichkeit der Geburt eines Knaben (oder Mädchens) bei einer anderen 
Mutter. Dies sind unabhängige Ereignisse. 

Für unabhängige Ereignisse nimmt das Multiplikationstheorem eine be- 
sonders einfache Gestalt an; wenn nämlich die Ereignisse A und B unabhängig 
sind, so ist 

P(AB) = P(A):P(B). 


Wir verallgemeinern nun den Begriff der Unabhängigkeit von zwei Ereig- 
nissen auf eine Gesamtheit von mehreren Ereignissen. 

Die Ereignisse B,, B,,..., B, heißen insgesamt unabhängig, wenn für jedes 
Ereignis B, von ihnen und für beliebige Ereignisse B,,, B,.:„B, (uk #P: 
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i,2p) von ihnen die Ereignisse B, und B;, B;, ... B;, voneinander unabhän- 
gig sind. 

Nach dem vorhergehenden ist diese Definition mit der folgenden äquivalent: 
Für beliebige 1 <<, <iu <...<i,<sundr(l<r<os)ist 


P{B, Ba... Bi} = P{B.} P{Bu}...P{B,}. 


Wir bemerken, daß für die Unabhängigkeit in Gesamtheit von gewissen 
Ereignissen ihre paarweise Unabhängigkeit nicht ausreicht. Davon überzeugt 
man sich leicht an dem folgenden einfachen Beispiel. Stellen wir uns vor, die 
Flächen eines Tetraeders seien gefärbt, die erste rot (A), die zweite grün (B), 
die dritte blau (C) und die vierte mit allen drei Farben (ABC). Man sieht 
leicht, daß die Wahrscheinlichkeit dafür, daß die Fläche, auf die das Tetraeder 


bei einem Wurf fällt, rote Farbe trägt, gleich + ist, denn es gibt vier Flächen, 


und zwei von ihnen tragen rote Farbe. Also ist 
1 


Genauso kann man berechnen, daß 
P(B) = P(C) = P(A/B) = P(B/C) = P(C/A) 
= P(B/A) = P(C/B) = P(A/C) = 5 


ist, die Ereignisse A, B, C sind also paarweise unabhängig. 
Wenn wir jedoch schon wissen, daß die Ereignisse B und C eingetreten sind, 
so muß notwendig auch das Ereignis A eingetreten sein, d.h., es ist 


P(AJBC) =1. 


In ihrer Gesamtheit sind also die Ereignisse A, B, C nicht unabhängig. 

Die Formel (1’), die wir im Falle der klassischen Definition der Wahrscheinlich- 
keit aus der Definition der bedingten Wahrscheinlichkeit ableiteten, wird im 
Falle der axiomatischen Einführung der Wahrscheinlichkeit als Definition 
benutzt. Somit ist also im allgemeinen Falle, wenn P(A) > 0, nach Definition 

_ P(AB) u: ' 
P(B/A) = PA) vg 
[im Falle P(A)= 0 bleibt die bedingte Wahrscheinlichkeit P(B/A) unbe- 
stimmt]. Dies gestattet es, automatisch alle Definitionen und Resultate dieses 
Paragraphen auf den allgemeinen Begriff der Wahrscheinlichkeit zu über- 
tragen. 

Wir wollen jetzt annehmen, daß das Ereignis B stets mit genau einem 
der n unvereinbaren Ereignisse A, Ay ..., A, zugleich eintritt. Mit anderen 
Worten, wir nehmen an, es sei 


B= BA, 6) 
i-1 
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die Ereignisse BA, und BA, mit verschiedenen Indizes i und j sind dabei 
unvereinbar. Nach dem Additionstheorem der Wahrscheinlichkeiten erhalten wir 


n 
P(B) = ZP(BA). 
Unter Benutzung des Multiplikationssatzes finden wir schließlich die Formel 
n 
P(B) =2zP(A) P(B/A,). 


Diese Gleichung heißt die Formel der totalen Wahrscheinlichkeit und spielt in 
der ganzen nun folgenden Theorie eine grundlegende Rolle. 
Zur Illustration betrachten wir zwei Beispiele. 


Beispiel 3. Gegeben seien 5 Urnen. Von ihnen besitzen 

2 Urnen den Inhalt A, — je zwei weiße Kugeln und 1 schwarze, 

1 Urne den Inhalt A, — 10 schwarze Kugeln, 

2 Urnen den Inhalt A, — je 3 weiße Kugeln und 1 schwarze. 

Auf gut Glück werde eine Urne ausgewählt und aus ihr eine Kugel heraus- 
gegriffen. 

Wie groß ist die Wahrscheinlichkeit dafür, daß die herausgenommene Kugel 
weiß ist (Ereignis B)? 

Da die herausgegriffene Kugel nur aus einer Urne vom Inhalt A, oder A, 
oder A, sein kann, so ist 


B=AB+A,B-+A,B. 


Nach der Formel der totalen Wahrscheinlichkeit finden wir: 
P(B) = P(A,) P(B/A,) + P(A,) P(B/A,) + P(A,) P(B/A,). 
Nun ist doch aber 


2 1 2 
PA)=4., PAd=z. PA)=4. 
2 3 
P(B/A,) = 7’ PBlA)=0, P(B/A,) = u 
Auf diese Weise erhalten wir schließlich 
; 2 2 1 23.8 17 
=; 5tFIt77"R 


Beispiel 4. Es sei bekannt, daß in einer Telefonzentrale im Zeitintervall £ 
mit der Wahrscheinlichkeit P;(k) (k = 0, 1,2,...)k Anrufe erfolgen. 

Unter der Annahme, daß die Anzahl der Anrufe in zwei benachbarten Zeit- 
intervallen unabhängige Ereignisse sind, bestimme man die Wahrscheinlichkeit 
dafür, daß in einem Zeitintervall der Länge 2 ts Anrufe erfolgen. 

5  Gnedenko 
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Lösung. Wir bezeichnen mit A* das Ereignis, daß im Zeitintervall r k An- 
rufe kommen. Offenbar gilt folgende Gleichung: 


a,=23y + NATT+ +4 AM 


sie besagt, daß man das Ereignis Ag, als eine Summe von s + 1 unvereinbaren 
Ereignissen auffassen kann, die darin bestehen, daß im ersten Zeitintervall 
der Länge ii Anrufe und im folgenden Zeitintervall der gleichen Länge 
s—i(i=0,1,2,...,s) Anrufe erfolgen. Nach dem Additionstheorem der 
Wahrscheinlichkeiten wird 


P(A2) = E: PLA; A). 


Nach dem Multiplikationssatz der Wahrscheinlichkeiten für unabhängige 
Ereignisse erhalten wir 


P(A: 447°) = P(A}) P(A2=") = Pi) - Pis—i). 
Setzt man also 
Py,4s) = P(A2)) , 
so ist 


Pad) = EPA) : Pie). © 


Später werden wir sehen, daß unter sehr allgemeinen Bedingungen P;(k) 
für k = 0, 1,2,... durch die Formel | 


Pi) = CH e- 0) 


mit einer gewissen Konstanten a Me ist. 
Aus Formel (6) finden wir 
8 
a year g-2at 1 
= u Ton re Den 
Nun ist doch aber 
8 8 


1 - I | 2 
2 ea a! u aa er 


i=0 


daher ergibt sich schließlich 
Ps) = Bert 


= WE LEN: 


Wenn also für ein Zeitintervall der Länge i die Formel (7) gilt, so bleibt diese 
Formel auch für Zeitintervalle der doppelten Länge und, wie man sich leicht 
überzeugt, auch für Intervalle einer beliebigen Vielfachheit von t ihrem Cha- 
rakter nach erhalten. 
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Wir sind nun in der Lage, die wichtigen Formeln von Bayss, oder, wie man 
auch manchmal sagt, die Formeln über die Wahrscheinlichkeit von Hypothesen 
abzuleiten. Es gelte wie früher die Gleichung (5). Gesucht ist die Wahrschein- 
lichkeit des Ereignisses A,, wenn bekannt ist, daß B eingetreten ist. Nach dem 
Multiplikationstheorem haben wir 


P(A; B) = P(B) P(A;/B) = P(A,) P(B/A,). 


Hieraus folgt 
P(A:) P(B/A;) , 


benutzen wir die Formel der totalen Wahrscheinlichkeit, so finden wir hieraus 
die Formel 
P(A;) P(B/4A;) f 


n 


ar P(B/4,) 


P(A[B) = 


Diese Formeln heißen die Formeln von BayYzs. Das allgemeine Schema ihrer 
Anwendung zur Lösung praktischer Aufgaben verläuft etwa folgendermaßen: 
Ein Ereignis B möge unter verschiedenen Bedingungen eintreten können, 
über die n Hypothesen A, A, ..., A„ gemacht werden können. Aus 
irgendwelchen Gründen seien bereits die Wahrscheinlichkeiten P(A,) dieser 
Hypothesen vor dem Versuch bekannt. Ferner sei bekannt, daß die Hypo- 
these A; dem Ereignis B die Wahrscheinlichkeit P(B/A,) erteilt. Es werde ein 
Versuch ausgeführt, in welchem das Ereignis B eintritt. Das führt zu der Not- 
wendigkeit, die Wahrscheinlichkeiten der Hypothesen A; erneut abzuschätzen; 
die Bayzsschen Formeln lösen dieses Problem quantitativ. 

Wir beschränken uns hier auf ein rein schematisches Beispiel, nur um den 
Charakter der mit Hilfe dieser Formeln zu lösenden Aufgaben zu veranschau- 
lichen. 


Beispiel 5. Gegeben seien 5 Urnen folgenden Inhalts: 


2 Urnen vom Inhalt A, mit je 2 weißen und 3 schwarzen Kugeln, 


2 Urnen vom Inhalt A, mit je einer weißen Kugel und 4 schwarzen Kugeln, 
eine Urne mit dem Inhalt A, mit 4 weißen Kugeln und einer schwarzen Kugel. 


Aus einer willkürlich ausgewählten Urne werde eine Kugel herausgenommen. 
Sie sei weiß (das Ereignis B). Wie groß ist nach dem Versuch die Wahrschein- 
lichkeit (die aposteriorische Wahrscheinlichkeit) dafür, daß die herausgegriffene 
Kugel aus der Urne vom Inhalt A, stammt? 

Nach Voraussetzung ist 


2 


PA)=-—, P(A)=-, P(A,) = 


’ 


ale lm 


| al 
ale al, 


PBA)=z; PBlA)=z; P(B/4) = 


5* 
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Nach der Bayzsschen Formel erhalten wir 


P(43) P(B/A;) 


As|B) = a EU 
P(A,/B) P(4,) P(B/4,) + P(4,) P(B/A,) + P(4,) P(B/4;) 


Genauso finden wir 
1 
5 


P(AlB)=4,  P(A/B)= 
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Wir bringen hier einige kompliziertere Beispiele für die Anwendung der bisher 
entwickelten Theorie. 

Beispiel 1.!) Zwei Spieler A und B führen ein Spiel so lange durch, bis 
einer von ihnen vollständig ruiniert ist. Das Kapital des ersten sei gleich a DM, 
das Kapital des zweiten bDM. Die Wahrscheinlichkeit zu gewinnen sei in 
jeder Partie für den Spieler A gleich p, für den Spieler B gleich 5; p+q=1 
(Remis ist nicht möglich). In jeder Partie ist der Gewinn eines Spielers (also 
der Verlust des anderen) gleich 1 DM. Gesucht ist die Wahrscheinlichkeit des 
Verlierens für jeden der Spieler (die Resultate der einzelnen Partien sollen von- 
einander unabhängig sein). 


Lösung. Bevor wir an die analytische Lösung der Aufgabe herangehen, 
wollen wir klären, welcher Sinn dem Begriff des elementaren Ereignisses dabei 
zukommt und wie die Wahrscheinlichkeit des uns interessierenden Ereignisses 
definiert ist. 

Unter einem elementaren Ereignis verstehen wir eine unendliche Folge von 


Spielergebnissen der einzelnen Partien. Z. B. besteht das Ereignis (A, A,A,...) 
darin, daß alle ungeraden Partien der Spieler A und alle geraden Partien der 
Spieler B gewinnt. Das zufällige Ereignis, daß der Spieler A ruiniert ist, be- 
steht aus all den elementaren Ereignissen, in denen der Spieler A sein ganzes 
Kapital früher verspielt hat als der Spieler B. Wir bemerken, daß jedes ele- 


mentare Ereignis eine abzählbare Folge aus den Buchstaben A und A ist. 
Daher kommen in jedem elementaren Ereignis, das in dem uns interessierenden 


1) In dieser Aufgabe über „den Ruin des Spielers‘‘ behalten wir ihre klassische Formu- 
lierung bei; sie läßt sich aber auch noch anders, z. B. folgendermaßen formulieren: Ein 
materielles Teilchen befinde sich auf einer Geraden im Punkte 0 und werde in jeder Sekunde 
einem zufälligen Stoß unterworfen, auf Grund dessen es sich um einen cm nach rechts mit 
der Wahrscheinlichkeit p oder um einen cm nach links mit der Wahrscheinlichkeit q = 
1— » bewegt. Wie groß ist die Wahrscheinlichkeit dafür, daß sich das Teilchen rechts 
vom Punkt mit der Koordinate b (b > 0) befindet, ehe es links von dem Punkt mit der 
Koordinate a zu liegen kommt (a < 0, a und 5b ganze Zahlen) ? 
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zufälligen Ereignis (dem Ruin des Spielers A) liegt, nachdem sich das Spiel 
durch den Ruin des Spielers A als beendet erweist, noch abzähibar oft A und 
A vor. 

Wir bezeichnen mit p,(N) die Wahrscheinlichkeit des Ruins des Spielers A 
im Verlauf von N Partien, wenn er vor Beginn der ersten Partie n DM besaß. 
Diese Wahrscheinlichkeit läßt sich leicht bestimmen; die Menge der elemen- 
taren Ereignisse besteht nur aus endlich vielen Elementen. Die Wahrschein- 
lichkeit jedes elementaren Ereignisses ist hier natürlich gleich p” 97” zu 
setzen, wo m die Anzahl des Auftretens von A, N—m die Anzahl des Auf- 
tretens von A unter der Anzahl N des Auftretens dieser beiden Buchstaben 
bezeichnet. Genauso seien q,(N) und r,(N) die Wahrscheinlichkeiten, daß der 
Spieler B verloren hat, bzw. daß das Spiel nach N Partien noch nicht be- 
endet ist. 

Mit wachsendem N nehmen die Zahlen p,(N) und q,(N) offenbar nicht ab 
und die Zahl r„(N) wächst nicht. Folglich existieren die Grenzwerte 

Pa = lim Pr(N) ’ 9, = lim q,(N) , r, = lim r,(N). 
No No No 
Diese Grenzwerte nennen wir die Wahrscheinlichkeiten dafür, daß A bzw. B 
verliert, oder daß schließlich das Spiel unentschieden ausgeht, wenn der Spieler A 
zu Anfang n DM und der Spieler B zu Anfang a +b—n DM besaß. Da bei 
beliebigem N > 0 


PN) + (N) + (N) = 1 
ist, ist im Limes 
Pat mt Mm= 1. 
Offensichtlich gilt ferner: 
1. wenn der Spieler A bereits am Anfang des Spiels das ganze Kapital be- 
sitzt, der Spieler B aber gar nichts hat, so ist 
Pa+=0; Yarr=1; ny=0; (1) 
2. wenn der Spieler A am Anfang des Spiels nichts besitzt und der Spieler B 
das ganze Kapital besitzt, so ist 
Pp=1, %=P0, n=0. () 


Wenn der Spieler A vor einer Partie n DM besitzt, so kann sein Ruin 
auf zwei verschiedene Weisen eintreten: Entweder er gewinnt die nächste Partie 
und verliert das ganze Spiel oder er verliert diese Partie und das ganze Spiel. 
Nach der Formel der totalen Wahrscheinlichkeit ist daher 


Pa=P'Pa+ıTt 9'Pa-ı: 


Bezüglich p, haben wir also eine Differenzengleichung gefunden; man sieht 
leicht, daß man sie folgendermaßen schreiben kann: 


(Pr — Pa—ı) =P (Pa+ı —Pn)- (2) 
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Wir betrachten zunächst die Lösung dieser Gleichung fürp =q = 
dieser Annahme wird | 


Pa+1 Pa = Pan Pa-ı ='"=Pı —-P=t 


mit einer Konstanten c. Hieraus finden wir 


w| - 
= 
g 
- 


Pa=Potne. 
Da p, = 1 und p,.+, = 0 ist, so wird 
BER, WERTE... 
Pan = a+b'‘ 
Die Wahrscheinlichkeit des Ruins des Spielers A ist also gleich 
_ı __a _5 
Pe] a+b a+b 


Analog finden wir, daß im Falle p — die Wahrscheinlichkeit des Ruins 
des Spielers B gleich 


1 


ist. Hieraus folgt, daß fürp=q = 7 


n=0 
ist. 
Im allgemeinen Falle erhalten wir für p > q aus (2) die Formel 


” n 
g" I (pr — Pr) = pP" (pr +1 — Pi) - 
k=-1 k-1 
Nach einigem Kürzen finden wir unter Berücksichtigung der Beziehungen (1’) 
Pa+1 "Pr -2 @-1) . 


Wir betrachten die Differenz p, +» — P„; offenbar ist 


Pa+5 — Pr I om — Pi) EL. 2) 
u e_ Fr Bir | 
TE 
p 


Da pa +5 = 0 ist, so wird 


oa 


Kein ———} 


$ 10. Beispiele 57 
da aber p, = 1 ist, ergibt sich die Gleichung 
q ’ En ( q ) +b 
el — 


1—-— 


p 


Eliminieren wir aus den beiden letzten Gleichungen die Größe p,, so finden 
wir 
(a)* (a ’ 
p p 


Ei 


Hieraus gewinnen wir die Wahrscheinlichkeit des Ruins des Spielers A zu 


Pa = 


te} 
FEN sine 2 q 
Pa ge+b_—pa+b 1-2)" R 
q 
Analog finden wir, daß die Wahrscheinlichkeit des Ruins des Spielers B für 


P #g gleich 
= 
p 


Ia = 1-2)” 
p 
ist. 
Die letzten beiden Formeln zeigen, daß auch im allgemeinen Falle die Wahr- 
scheinlichkeit eines unentschiedenen Ausgangs des Spiels gleich Null ist: 


n=0. 


Aus diesen Formeln können wir folgende Schlüsse ziehen: Ist das Kapital 
eines der Spieler, z. B. des Spielers B, unvergleichlich größer als das Kapital 
des Spielers A, so daß man praktisch 5 im Vergleich zu a als unendlich groß 
ansehen kann, und sind beide Spieler gleich gewandt, so ist ein Ruin von B 
praktisch unmöglich. Dies ändert sich schon bedeutend, wenn A besser spielt 
als B, d.h. wenn p > gist. Nimmt man b oo an, so wird‘ 

ir 
Ga m () 
und 


Hieraus schließen wir, daß ein befähigter Spieler sogar mit einem kleinen 
Kapital kleinere Verlustchancen haben kann als ein Spieler mit großem Kapital, 
der weniger gewandt ist. 
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Auf die Aufgabe über den Ruin eines Spielers läßt sich die Lösung gewisser 
Probleme der Physik und der Technik zurückführen. 


Beispiel 2. Gesucht ist die Wahrscheinlichkeit dafür, daß eine Maschine, 
die im Zeitpunkt {, arbeiteie, bis zum Zeitpunkt ?, -+ £ nicht stehen bleibt, 
wenn man weiß, daß 1. diese Wahrscheinlichkeit nur von der Größe des Zeit- 
intervalls (f,, £) + 2) abhängt, 2. die Wahrscheinlichkeit dafür, daß die Maschine 
im Zeitintervall At stehen bleibt, bis auf unendlich kleine Größen höherer 
Ordnung bezüglich Ai zu At proportional ist.!) 

Die Ereignisse, die darin bestehen, daß die Maschine in disjunkten Zeit- 
intervallen stehen bleibt, seien voneinander unabhängig. 

Lösung. Wir bezeichnen die gesuchte Wahrscheinlichkeit mit p(f). Die 
Wahrscheinlichkeit dafür, daß die Maschine im Zeitintervall AZ stehen bleibt, 
ist gleich 

1— p(Al) = a At +o(At), 


wo a eine gewisse Konstante ist. 

Wir bestimmen die Wahrscheinlichkeit dafür, daß eine Maschine, die im 
Zeitpunkt Z, gearbeitet hat, bis zum Zeitpunkt i, + £ + At nicht stehen bleibt. 
Für das Eintreten dieses Ereignisses ist es notwendig, daß die Maschine während 
der Zeitintervalle der Länge ? und At nicht stehen geblieben ist. Nach dem 
Multiplikationssatz ist also 


p(t + Al) = pl) - p(Al) = pl) (1 — a At— 0 (AN). 


Hieraus folgt 


Ber M EM __ pp —c). © 


Hierin gehen wir nun zur Grenze 4{— 0 über; da der Grenzwert der rechten 
Seite der Gleichung (3) existiert, muß auch der Grenzwert der linken Seite 
existieren. Auf diese Weise finden wir 


dpli) ___ 
ei, pd. 


Die Lösung dieser Gleichung ist die Funktion 
pi) = Ce", 

wobei die Konstante C noch frei wählbar ist. Sie wird durch die Bedingung 
p(0) = 1 festgelegt. Damit wird schließlich?) 
pö = ec". 


1) Um im folgenden anzudeuten, daß eine Größe & im Vergleich zu einer Größe ß un- 
endlich klein ist, benutzen wir die Schreibweise & = o(ß). Ist aber der Quotient &/ß dem 
Betrage nach beschränkt, so schreiben wir & = O(ß). 

2) Wenn man die Überlegung etwas abändert, kann man zeigen, daß dieses Resultat 
auch dann gilt, wenn man die zweite Bedingung der Aufgabe wegläßt. 
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Die erste Bedingung der Aufgabe legt der Arbeitsorganisation für die Ma- 
schine große Beschränkungen auf, jedoch gibt es Produktionszweige, in denen 
sie mit großer Genauigkeit erfüllt sind. Als Beispiel kann man die Arbeit 
einer automatischen Textilmaschine anführen. Wir weisen darauf hin, daß 
man auf die betrachtete Aufgabe eine ganze Reihe anderer Fragen zurück- 
führen kann, z.B. die Frage über die Wahrscheinlichkeitsverteilung der freien 
Weglänge eines Moleküls in der kinetischen Gastheorie. 


Beispiel 3. Bei der Aufstellung von Sterblichkeitstabellen geht man häufig 
von folgenden Annahmen aus: 
1. Die Wahrscheinlichkeit dafür, daß eine Person im Zeitintervall von £ 
bis t + At stirbt, ist gleich 
pt, t + Al) = alt) At + o(At), 
wobei a(f) eine nichtnegative stetige Funktion ist. 


2. Es werde angenommen, daß der Tod einer Person (oder ihr Weiterleben) 
in einem betrachteten Zeitintervall (£,, £,) nicht davon abhängt, was vor dem 
Zeitpunkt {, war. 


3. Die Wahrscheinlichkeit des Todes im Zeitpunkt der Geburt ist gleich Null. 
Ausgehend von diesen Voraussetzungen bestimme man die Wahrscheinlich- 
keit dafür, daß eine Person A stirbt, bevor sie das Alter £ erreicht hat. 


Lösung. Wir bezeichnen mit x(f) die Wahrscheinlichkeit dafür, daß die 
Person A bis zum Alter ? lebt und berechnen x(£ + At). Offenbar ergibt sich 
aus den in der Aufgabe angenommenen Voraussetzungen die Gleichung 


at + A) = aft) n(t + At;t), 


dabei bezeichnet x (£ + At; t) die Wahrscheinlichkeit dafür, daß die Person A 
noch bis zum Alter ? -+ At weiterlebt, falls sie schon das Alter ? erreicht hat. 
Auf Grund der ersten beiden Annahmen ist 


alt + A; = 1 — plt,t + A) =1— alt) At— o(At) ; 
daher wird 
at + Al) = ati) [1 — alt) At — o(Al)]. 


Hieraus finden wir, daß x(i) der folgenden Differentialgleichung genügt: 


dat) _ 
2 alt) z{t).. 
Die Funktion 
-_ h a(2) de 
a()=e 


stellt unter Berücksichtigung der dritten Bedingung die Lösung dieser Glei- 
chung dar. 
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Die Wahrscheinlichkeit dafür, daß die Person A vor Erreichen des Alters t 
stirbt, ist also gleich 


[ate) de 
1-a)=1—e 


Bei der Aufstellung von Sterblichkeitstabellen für die erwachsene Bevöl- 
kerung wird nicht selten die Formel von MAREHAM benutzt, nach der 


al)=a+Bßet 
ist, wo «, ß, y positive Konstanten sind.!) Bei der Ableitung dieser Formeln 
ging man von der Annahme aus, daß ein Erwachsener aus solchen Ursachen 
sterben kann, die nicht notwendig vom Alter abhängen, und aus solchen, die 
wohl vom Alter abhängen, wobei die Sterbewahrscheinlichkeit mit wachsendem 
Alter in einer geometrischen Progression wächst. Unter dieser zusätzlichen 
Annahme ist 
1-2 ei_y 
a) = e ® i 
Beispiel 4. In der modernen Kernphysik wird zur Messung der Intensität 
einer Teilchenquelle der GmiGeR-Müuer-Zähler benutzt. Ein Teilchen, das in 
den Zähler fällt, ruft in ihm eine Entladung hervor, die r Sekunden anhält, 
in deren Verlauf der Zähler keine in ihn fallenden Teilchen registriert. Gesucht 
ist die Wahrscheinlichkeit dafür, daß der Zähler alle Teilchen zählt, die in ihn 
im Zeitintervall { fallen, wenn die folgenden Bedingungen erfüllt sind: 


1. Die Wahrscheinlichkeit dafür, daß im Zeitintervall 2 in den Zähler k Teil- 
chen fallen, hängt nicht davon ab, wie viele Teilchen vor diesem Zeitintervall 
in den Zähler gefallen sind, 


2. die Wahrscheinlichkeit dafür, daß während eines Zeitintervalls {, bis 
i, + £in den Zähler k Teilchen fallen, wird durch die Formei 
(a t)kerat 


Po +D) = r 
gegeben, wo a eine positive Konstante ist?); 
3. r ist eine Konstante. 


Lösung. Wir bezeichnen mit A(f) das Ereignis, daß alle im Zeitintervall £ 
in den Zäller fallenden Teilchen gezählt werden. Mit B;,(i) bezeichnen wir das 
Ereignis, daß in der Zeit {in den Zähler k Teilchen gefallen sind. 


1) Ihre Werte werden durch die Bedingungen bestimmt, unter denen sich die untersuchte 
Personengruppe befindet, vor allem durch soziale Bedingungen. 
2) Später erklären wir, weshalb wir in diesem Beispiel und im Beispiel 2 des vorigen 
Paragraphen annehmen konnten, daß 
Br (at)k eret 
sa ° 
ist. 
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Nach der ersten Bedingung der Aufgabe ist für! > r 
P{A(t + Ay} = P{A(d)} P{B.(Ad} + P[A— DJ} P{Bod)} P{B(AH} + o(At), 
und für 0 <i<r 
P{Ad + Ad} = P{A(d} PiBo(AN} + P{Bod} PiBi(Ay} + o(4t). 


Wir setzen zur Abkürzung z(f) = P{A(t)}; dann ist auf Grund der zweiten 
und dritten Bedingung der Aufgabe für0 <t<r 


alt + A) = Al) A Her aAdtet' + old) 
und für !>r 
rt + At) = at) e** + alt — Tr) ed a Ate! + 0o(At). 
Durch Grenzübergang für At—0 finden wir, daß für 0<1i<r die Gleichung 
N 


— an) +ae*! (4) 
und für t > r die ee 
dr(t 
N = — am) — at) e*] 6) 
besteht. 
Aus der Gleichung (4) finden wir, daß für0 <!<r 
aA) = e*'(c+at) 
ist. Aus der Bedingung 
(0) —=1 
bestimmen wir die Konstante c. Schließlich wird für0 <i<r 
rd) =e*"(l1-+at). (6) 


Fürr<t<2rläßt sich die Wahrscheinlichkeit x(tf) aus der Gleichung 
N = — ala) at) e*] 
= — a[r{t) — et N (1 + alt — T)) e**] 
= — ala) —e“'(1+a(t—v))] 
bestimmen. Die Lösung dieser Gleichung ergibt uns 
= (+ at N). 
Die Konstante c, läßt sich daraus bestimmen, daß nach (6) 
ale) =e""(l+ar 
ist. Alsoist, =1lundfürr<t<2r 


al) = et l ta. 
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Durch vollständige Induktion kann man beweisen, daß für (n— I)r<t<nr 
die Gleichung 


Nn_„k k 
er ak ft — (k— 1) 7] 
EN m 
k=0 
gilt. 
Übungen 
1. A, B, C seien zufällige Ereignisse. Welche Bedeutung haben die Gleichungen 
a) ABÜ=4; b) A+B+C0=4? 
2. Man vereinfache die Ausdrücke 
a) (A+B)(B+0); b)(A+B)(A+B); 


e)(A+B)(A+B)(A+B). 


3. Man beweise die Gleichungen 


2) ÄB=A+B; b)A+B=AB; 
)A+At++m=A As: An; 
YA ehrt HZ 


4. Ein vierbändiges Werk stehe auf einem Regal in einer zufälligen Ordnung. Wie groß 
ist die Wahrscheinlichkeit dafür, daß die Bände in der richtigen Reihenfolge von 
rechts nach links oder von links nach rechts stehen ? 


5. Die Zahlen 1, 2, 3, 4, 5 werden auf 5 Karten geschrieben. Auf gut Glück werden 
nacheinander 3 Karten herausgegriffen und die so ausgewählten Ziffern von links 
nach rechts aufgeschrieben. Wie groß ist die Wahrscheinlichkeit dafür, daß die so 
gewonnene dreistellige Zahl gerade ist ? 


6. In einer Sendung aus N Einzelteilen seien M fehlerhafte Stücke. Auf gut Glück 
werden aus dieser Sendung n Stück herausgegriffen (n < N). Wie groß ist die Wahr- 
scheinlichkeit dafür, daß unter ihnen m fehlerhafte sind (m < M)? 


7. Die technische Kontrolle prüft eine Sendung, die aus m Stück der ersten Sorte und n 
Stück der zweiten Sorte besteht. Die Nachprüfung der ersten b aus der Sendung will- 
kürlich herausgegriffenen Stücke zeige, daß sie alle von der zweiten Sorte sind (b <.n). 
Wie groß ist die Wahrscheinlichkeit dafür, daß unter den beiden folgenden auf gut 
Glück aus den noch nicht geprüften Stücken herausgegriffenen wenigstens eines 
ebenfalls von der zweiten Sorte ist ? 


8. Unter Benutzung von wahrscheinlichkeitstheoretischen Überlegungen beweise man 
die Identität (A > a) 
4—a , (A—a) (A—a—|]) (A—a)...2-1 A 
VdS I N N re Tess ae N RN 
ET! (A—1) (4—2) + TA-5..BIVe a 
Hinweis: Aus einer Urne, die A Kugeln enthält, unter ihnen a weiße, werden auf gut 
Glück Kugeln ohne Zurücklegen herausgegriffen. Man bestimme die Wahrscheinlich- 
keit dafür, daß man früher oder später auf eine weiße Kugel stößt. 


9. Aus einem Kasten mit m weißen und n schwarzen Kugeln (m > n) wird auf gut Glück 
eine Kugel nach der anderen herausgegriffen. Wie groß ist die Wahrscheinlichkeit 


10. 


11. 


13. 


14, 


15. 


16. 


17. 


18. 
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dafür, daß einmal der Zeitpunkt kommt, wo die Anzahl der herausgenommenen 
schwarzen Kugeln gleich der Anzahl der herausgenommenen weißen Kugeln ist ? 


Jemand schreibt an n Leute Briefe und beschreibt dazu n Briefumschläge. In jeden 
Umschlag legt er auf gut Glück je einen Brief. Wie groß ist die Wahrscheinlichkeit 
dafür, daß wenigstens ein Brief in den dafür bestimmten Briefumschlag kommt ? 


In einer Urne liegen n Karten mit den Zahlen von 1 bis n. Die Karten werden auf gut 
Glück eine nach der anderen herausgenommen. Wie groß ist die Wahrscheinlichkeit 
dafür, daß wenigstens einmal die Zahl auf der herausgenommenen Karte mit der 
Anzahl der bis dahin herausgenommenen Karten zusammenfällt ? 


2. Aus einer Urne mit n weißen und r schwarzen Kugeln wird auf gut Glück!) eine gerade 


Anzahl von Kugeln herausgenommen. Gesucht ist die Wahrscheinlichkeit dafür, 
daß unter den herausgenommenen Kugeln gleichviele schwarze und weiße sind ? 


Aufgabe des CHEVALIER DE M£firf. Was ist wahrscheinlicher: in einem Wurf von 
4 Würfeln auf wenigstens einem eine Eins zu erhalten oder bei 24 Würfen von zwei 
Würfeln wenigstens einmal zwei Einsen zu bekommen ? 


Auf das Intervall (0, a) werden auf gut Glück 3 Punkte geworfen. Gesucht ist die 
Wahrscheinlichkeit dafür, daß man die Intervalle, die diese Punkte mit dem Null- 
punkt bilden, zu einem Dreieck zusammensetzen kann. 


Ein Stab der Länge ! wird in zwei auf gut Glück ausgewählten Punkten zersägt. Wie 
groß ist die Wahrscheinlichkeit dafür, daß man aus den so gewonnenen Stücken ein 
Dreieck zusammensetzen kann ? 


Auf ein Intervall AB der Länge a wird auf gut Glück ein Punkt geworfen. Auf das 
Intervall BC der Länge b wird ebenfalls ein Punkt auf gut Glück geworfen. Wie groß 
ist die Wahrscheinlichkeit dafür, daß man aus den Intervallen 


l. vom Punkt A bis zum ersten geworfenen Punkt, 
zwischen den beiden geworfenen Punkten, 


2 
3. vom zweiten geworfenen Punkt bis zum Punkt € 
ein Dreieck zusammensetzen kann ? 


In einer Kugel vom Radius R sind zufällig und unabhängig voneinander N Punkte 

verteilt, 

a) wie groß ist die Wahrscheinlichkeit dafür, daß der Abstand des Mittelpunktes der 
Kugel vom nächsten Punkt nicht kleiner als o ist? 


b) gegen welchen Wert strebt die unter a) gefundene Wahrscheinlichkeit, wenn R> 
4 


N 

und w’z7” 4? 
Bemerkung: Diese Aufgabe ist der Astronomie entnommen; in der Umgebung der 
Sonne ist A -— 0,0063, wenn R in Parsec gemessen wird. 
Die Ereignisse A,, Ag, . . - , A, seien unabhängig; P(A;) = pr . Gesucht ist die Wahr- 
scheinlichkeit dafür, daß 
a) wenigstens eines dieser Ereignisse eintritt, 
b) keines dieser Ereignisse eintritt, 
c) genau eines der Ereignisse eintritt (ganz gleich welches). 


!) Alle verschiedenen Möglichkeiten des Herausgreifens einer geraden Anzahl von 


Kugeln seien, unabhängig von der Anzahl der herausgenommenen Kugeln, gleichwahr- 
scheinlich. 


64 


19, 


20. 


21. 


22. 


I. Der Begriff der Wahrscheinlichkeit 


Man beweise: Sind die beiden Ereignisse A und B unvereinbar und gilt P(4) > O und 
P(B) >0, so sind die Ereignisse A und B abhängig. 


Ay Ag +.» , An seien zufällige Ereignisse. Man beweise die Formel 


n n 

p 2, Al ZPra— 5 _ P(4,4) 
k=1 i=] 1<si<jsn 

+ P(4, 4; A) F... + P(4, 42... An). 

1<i<j<ksn 


Mit Hilfe dieser Formel löse man die Aufgaben 10. und 11. 


Die Wahrscheinlichkeit dafür, daß ein Molekül, das im Zeitpunkt = 0 mit einem 
anderen Molekül zusammengestoßen ist und bis zum Zeitpunkt t keine weiteren Stöße 
erfahren hat, im Zeitintervall zwischen ? und £ + At mit einem Molekül zusammen- 
stößt, ist gleich A At + o(At). Gesucht ist die Wahrscheinlichkeit dafür, daß die 
Zeit des freien Weges (d.i. die Zeit zwischen zwei aufeinander folgenden Stößen) 
größer als £ ist. 


Wir wollen annehmen, daß bei der Vermehrung von Bakterien durch Teilung (in 
2 Bakterien) die Wahrscheinlichkeit dafür, daß sich eine Bakterie im Zeitintervall At 
teilt, gleich a At -+ o(4t) ist und nicht von der Zahl der vorhergegangenen Teilungen 
sowie von der Anzahl der vorhandenen Bakterien abhängt. Gesucht ist die Wahr- 
scheinlichkeit dafür, daß im Zeitpunkt t gerade i Bakterien vorhanden sind, wenn im 
Zeitpunkt t = 0 eine Bakterie da war. 


II. 


EINE FOLGE UNABHÄNGIGER VERSUCHE 


In diesem Kapitel untersuchen wir die grundlegenden Gesetzmäßigkeiten, 
die eines der wichtigsten Schemata der Wahrscheinlichkeitsrechnung — das 
Schema einer Folge unabhängiger Versuche — beherrschen. Unter diesem 
Begriff wollen wir folgendes verstehen. 

Wir betrachten eine Folge vollständiger Gruppen von Ereignissen A, 
AB,..., AP, s=1,2,...,n. Die Wahrscheinlichkeit für das Eintreten 
des Ereignisses AP(i=1,2,..., k) in der Gruppe mit dem Index s hängt 
weder von diesem Index ab, noch davon, welche Ereignisse in den anderen 
Gruppen eingetreten sind oder noch eintreten werden.!) 

Häufig erweist es sich als zweckmäßig, eine andere Terminologie zu benutzen. 
Man sagt dann, es werden n unabhängige Versuche ausgeführt, wobei in jedem 


eins von k unvereinbaren Versuchsergebnissen AP, AW,..., A eintreten 
kann. Die Wahrscheinlichkeit des Versuchsergebnisses A{" hänge dabei nicht 
von der Nummer s des Versuches ab und sei gleich p;(i=1,2,...,%k); auf 


Grund der Unvereinbarkeit der Versuchsergebnisse und da eines der Versuchs- 
ergebnisse A{" eintreten muß, gilt offenbar die Gleichung 3 p;=1. Dieses 
Schema untersuchte als erster J. BERNOULLI in dem wichtigsten Spezialfall 
k = 2; aus diesem Grunde nennt man diesen Fall das BernovLuische Schema. 
Im Bernovıuıschen Schema setzt man gewöhnlich , =p, nr =1—p=4. 

Die genauere Untersuchung solcher Folgen von Versuchen verdient besondere 
Beachtung sowohl wegen ihrer unmittelbaren Bedeutung in der Wahrschein- 
lichkeitsrechnung und deren Anwendungen, als auch aufGrund der im Zuge der 
Entwicklung der Wahrscheinlichkeitsrechnung aufgetretenen Möglichkeit der 
Verallgemeinerung jener Gesetzmäßigkeiten, die man zuerst bei der Unter- 
suchung des Schemas einer Folge von unabhängigen Versuchen, insbesondere 
beim Bernovitıschen Schema, aufdeckte. Viele Tatsachen, die man an 
diesem speziellen Schema bemerkte, dienten in der Folge als Leitfaden bei 
der Untersuchung komplizierterer Schemata. Diese Bemerkung bezieht sich 
sowohl auf die bisherige als auch auf die heutige Entwicklung der Wahrschein- 
lichkeitsrechnung. Davon kann man sich im folgenden an den Beispielen des 
Gesetzes der großen Zahlen und des Satzes von MoIVRE-LAPLACE überzeugen. 


!) DemSchema einer Folge unabhängiger Versuche kann man auch einen umfassenderen 
Sinn zulegen, indem man annimmt, daß die Anzahl der möglichen Versuchsergebnisse und 
ihre Wahrscheinlichkeiten von der Nummer des Versuchs abhängen. Diese allgemeineren 
Fassungen lassen wir jedoch beiseite. 
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$ 11. Die Wahrscheinlichkeiten P„(m,, Ms, . . ,mMx) 


Die einfachste Aufgabe, die mit einem Schema unabhängiger Versuche 
in Beziehung steht, besteht in der Bestimmung der Wahrscheinlichkeit 
P,(m, m, ...,m;) dafür, daß bei n Versuchen die Ereignisse A@ m,-mal, AY 
my-mal, ..., AP m;-mal eintreten. Dabei muß natürlich die Gleichung (1) 


m+m+--+m=n 


erfüllt sein. Wir beschränken uns darauf, diese Aufgabe für den Fall des 
Bernouruischen Schemas genauer zu untersuchen und überlassen dem Leser 
die Ableitung der Formel und ihre Diskussion im allgemeinen Falle. Für das 
Bersovrtische Schema bezeichnen wir das Ereignis A® mit A®, das Er- 
eignis AY mit A®, die Anzahl des Eintretens der Ereignisse A®) mit » und 
die Wahrscheinlichkeit P,(m,, m;) mit P,„(m); dabei stm=m,. 

Wir suchen zunächst die Wahrscheinlichkeit dafür, daß die Ereignisse A® 
bei m bestimmten Versuchen (z.B. bei s, ‚5... ,s„) auftreten und bei den 
übrigen n— m nicht auftreten. Nach dem Multiplikationstheorem für unab- 
hängige Ereignisse ist diese Wahrscheinlichkeit gleich 


p” ge; 


Nach dem Additionstheorem der Wahrscheinlichkeiten ist die gesuchte Wahr- 
scheinlichkeit P,(m) gleich der Summe der eben berechneten Wahrscheinlich- 
keiten über alle verschiedenen Möglichkeiten, daß bei n ausgeführten Versuchen 
m-mal die Ereignisse A® eintreten und n—m-mal nicht eintreten. Die 
Anzahl dieser Möglichkeiten ist, wie man aus der Kombinatorik weiß, gleich 


cn = ee. DEE ; die gesuchte Wahrscheinlichkeit ist also gleich 


m! (n — m) 


P,«m) = Hp" ". (1) 


Da alle möglichen miteinander unvereinbaren Ergebnisse von rn Versuchen 
darin bestehen, daß die Ereignisse A O-mal, 1-mal, 2-mal, ..., n-mal ein- 
treten, so ist offensichtlich 


ZPıxm)=1. 
m=0 


Diese Beziehungen kann man auch ohne wahrscheinlichkeitstheoretische Über- 
legungen aus der Gleichung 


n 
ZP,\a)=p+"=1"=-1 
m=0 
ableiten. Man übersieht leicht, daß die Wahrscheinlichkeit P,(m) gleich dem 
Koeffizienten von 2” in der Entwicklung des Binoms (g + px)" nach Po- 
tenzen von x ist; auf Grund dieser Eigenschaft heißt die Gesamtheit der Wahr- 
scheinlichkeiten P,(in) das Binomialgesetz der Wahrscheinlichkeitsverteilungen. 
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Durch geringe Abänderungen unserer Überlegungen überzeugt sich der Leser 
leicht von der folgenden Gleichung 


n! 


P,(m, my ...,my) = ET BERRTL ee Ze (1) 


und er sieht ferner ohne Mühe, daß diese Wahrscheinlichkeit gleich dem Koeffi- 
zienten von a": 27%... x” in der Entwicklung des Polynoms 


(Pt +P%a+t'''+ Prz)" 
nach Potenzen von x ist. 

Unser Ziel ist es nun, allgemeinere Aufgaben zu stellen, die mit einem Schema 
unabhängiger Versuche in Beziehung stehen. Dazu betrachten wir einige 
Zahlenbeispiele. In diesen Beispielen werden wir die Berechnung der gesuchten 
Wahrscheinlichkeit nicht ganz bis zu Ende durchführen. Wir wollen dies bis 
zu dem Augenblick zurückstellen, wo wir geeignetere Methoden zu ihrer Be- 
rechnung entwickelt haben. 


Beispiel 1. Gegeben seien zwei Gefäße A und B mit dem Volumen 10 cm®. 
In jedem von ihnen seien 2,7. 10°? Gasmoleküle enthalten. Diese Gefäße 
werden nun so miteinander verbunden, daß zwischen ihnen ein freier Austausch 
der Moleküle möglich ist. Wie groß ist die Wahrscheinlichkeit dafür, daß sich 
nach 24 Stunden in einem der Gefäße wenigstens ein Zehnmilliardstel mehr 

| Moleküle als in dem anderen befinden. 
Für jedes Molekül ist die Wahrscheinlichkeit dafür, daß es sich nach 24 Stun- 


den in dem einen oder anderen Gefäß befindet, ein und dieselbe und gleich R 
Würde man daher 5,4 - 10% Versuche ausführen, so ist für jeden dieser Ver- 
suche die Wahrscheinlichkeit, daß das Molekül in das Gefäß A fällt, gleich 5- & 
Sei nun u die Anzahl der Moleküle, die in das Gefäß A fällt, dann ist 5,4 - 10% —ı 


die Anzahl der Moleküle, die in das Gefäß B fallen. Wir müssen nun die Wahr- 
scheinlichkeit dafür bestimmen, daß 
5,4 - 1022 


Ir — (5,4 - 109 — u)| > Tg 94 1008 


ist, d.h. wir müssen die Wahrscheinlichkeit 
p = P{]u— 2,7. 1022| > 2,7 . 1022} 
finden. Nach dem Additionstheorem ist 
p=ZP{a=m}, 
die Summe wird dabei über alle Werte m erstreckt, für die 
Im — 2,7 . 10%| > 2,7 . 101% 
M ist. 


Beispiel 2. Die Wahrscheinlichkeit für das Auftreten von Ausschuß bei 
einer Produktion sei gleich 0,005. Wie groß ist die Wahrscheinlichkeit dafür, 
6  Gnedenko 
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daß von 10000 willkürlich herausgegriffenen Erzeugnissen die Anzahl der 
fehlerhaften Stücke a) gleich 40, b) nicht größer als 70 ist? 
In unserem Beispiel ist n = 10000, p = 0,005; aus der Formel (1) finden 
wir daher en 
a) Pyoo00 (40) = C}6.000 (0,995)? (0,005) . 


Die Wahrscheinlichkeit P {a < 70} dafür, daß die Anzahl der fehlerhaften 
Stücke nicht größer als 70 ist, ist gleich der Summe der Wahrscheinlichkeiten 
dafür, daß diese Anzahl gleich 0, 1,2,..., 70ist. Also ist 


b) P{u< 70} = 5 P,(m) = 5 Cio 000 (0,995)! 000” (0,005)” . 
m=0 m=0 


Die betrachteten Beispiele zeigen, daß die direkte Berechnung der Wahr- 
scheinlichkeiten nach der Formel (1) [wie auch nach der Formel (1’)] häufig 
große technische Schwierigkeiten bereitet. Es ergibt sich daher die Notwendig- 
keit, einfache approximative Formeln für die Wahrscheinlichkeiten P,(m) , 
sowie für Summen der Form 

[2 

2& P,(m) 

m=e 
für große Werte von n aufzufinden. Diese Aufgabe werden wir in den $$ 12 
und 13 lösen. Wir stellen nun einige elementare Eigenschaften der Wahrschein- 
lichkeiten P,(m) bei konstantem n zusammen. Wir beginnen mit der Unter- 
suchung von P,(m) als einer Funktion von m. Für 0 <m<<n ist — wie man 

leicht ausrechnet — 

Phm+1) _n—m 


P,„(m) m+1 " 
hieraus ergibt sich die Ungleichung 
P.(m +1) > P,(m) , 
wenn (n—m)p>(m-+1)g,d.h., wenn np—q> mist; es ist 
P,(m +1) = P,(m) , 
falls m =np—-q und schließlich 
P.(m +1) < Pı(m) , 


a |r8 


falls m >np—q ist. 

Wir sehen, daß die Wahrscheinlichkeit P,(m) mit wachsendem m zunächst 
anwächst, dann ein Maximum erreicht und bei weiterem Wachsen von m 
wieder fällt. Ist dabei n p — q eine ganze Zahl, so nimmt die Wahrscheinlich- 
keit P,(m) für zwei Werte m, nämlich fürm, =np—qgundm, =np—q+1 
=np-+P, einen maximalen Wert an. Ist jedoch np — gq keine ganze Zahl, 
so erreicht die Wahrscheinlichkeit P,(m) ihren maximalen Wert fürm= m, ; 
m, ist gleich der kleinsten ganzen Zahl, die größer als m, ist. Die Zahl m, 
heißt der wahrscheinlichste Wert für u. Ist np —.g eine ganze Zahl, so besitzt 
— wie wir sahen — u die zwei wahrscheinlichsten Werte m, und, =m, +1. 
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Wir bemerken, daß für np — q > 0 die Ungleichungen 
P,(0) > Pa) >> Pıln), 
und für np —q = 0 die Ungleichungen 
P„(0) = Pı(1) > Pa@) >» > P,(n) 
bestehen. 

Im folgenden werden wir sehen, daß bei großen Werten von n die Wahr- 
scheinlichkeiten P,(m) nur für solche m merklich von O0 verschieden sind, die 
in der Nähe des wahrscheinlichsten Wertes u liegen. Diesen Tatbestand werden 
wir später beweisen, hier wollen wir das Gesagte bereits durch ein Zahlen- 
beispiel aufzeigen. 

Beispiel3. Es sein = 50, p =; : 

Es gibt zwei wahrscheinlichste Werte:m, =np— q = 16undm, +1 = 17. 

Die Werte für die Wahrscheinlichkeiten P,(m) sind auf vier Stellen hinter 
dem Komma genau in der Tabelle 5 angegeben. 


Tabelle 5 


0,0332 | 
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Bei der Betrachtung der Zahlenbeispiele des vorigen Paragraphen stellten 
wir fest, daß für große Werte n, m, m, ...,m; die Berechnung der Wahr- 
scheinlichkeiten P,(m,, mg, ...,m;) nach der Formel (1’) des $11 beträcht- 
liche Schwierigkeiten bereitet. Es ergibt sich daher die Notwendigkeit, asym- 
ptotische Formeln aufzustellen, die es gestatten, diese Wahrscheinlichkeiten mit 
hinreichender Genauigkeit zu berechnen. Eine Formel dieser Art wurde zu- 
erst von Moıvre im Jahre 1730 für einen Spezialfall des BERNoULLIschen 


Schemas, für p=q =; ‚ gefunden und später von LarLacz auf den Fall 


eines beliebigen, von 0 und 1 verschiedenen p verallgemeinert. 

Diese Formel wird allgemein die LarLaczsche Formel genannt, der histo- 
rischen Richtigkeit halber nennen wir sie die Morvee-Larzaczsche Formel. 
6* 
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Wir beginnen zunächst mit dem Beweis eines analogen Satzes für den allgemei- 
nen Fall eines Schemas unabhängiger Versuche und gewinnen daraus dann als 
Spezialfall den Satz von MoIVRE-LAPLAORE. 

Bevor wir den Satz formulieren, führen wir einige Bezeichnungen ein: Wir 
setzen 

4: =1—Pp G=l,2,:..50; 
m; — np; . (1) 
Yyr pi 

Die Größe x; hängt nicht nur von i (d.h. von p;), sondern auch von n und 


von m; ab; zur Vereinfachung der Schreibweise führen wir jedoch keine neuen 
Indizes ein. 


= 


Derlokale Grenzwertsatz. Wenn die Wahrscheinlichkeiten P,, Pa - - - » Pk 
für das Eintreten der entsprechenden Ereignisse AD, AW,..., AP im s-ten Ver- 
such nicht von der Nummer des Versuches abhängen und von 0 und 1 verschie- 
den sind O<p;<1I, i=1,2,...,k), so gilt für die Wahrscheinlichkeit 
P,(m, m,,...,m;,) dafür, daß bei n unabhängigen Versuchen die Ereignisse 
AP (i=1,2,...,k) m;-mal auftrelen (m +m; + ---+ m, = n) die Bezie- 
hung?) 


J; k F 
= P} G:% 
i=1 
k—1 

(2x) ? VPı Pa‘ Pr 
gleichmäßig für allem;,(i=1,2,...,k), für welche die x, in beliebigen endlichen 
Intervallen 3 << b, enlhalten sind. 


nk P,(m, My, ..., my): —1 (n-o) (2) 


Beweis. Der nun folgende Beweis stützt sich auf die aus der Analysis 
bekannte STIrLinasche Formel 


s| = Vans steh; 


darin genügt der Exponent ©, der Ungleichung 
1 
el<y-- 6) 


Die Formel (1) läßt sich auch in der Form 


mM=nPpt&ynpg () 


schreiben; hieraus folgt, daß, wenn die x; beschränkt bleiben, die ihnen ent- 
sprechenden Zahlen m; zusammen mit n unbeschränkt wachsen. 


1) Diese Limesbeziehung ist in homogenen Koordinaten geschrieben; die Größen x; 
hängen durch die Beziehung 3 x; /p; q; = 0 miteinander zusammen, die man leicht mit 
Hilfe der Gleichungen 3 m; = rn und 5 p; = 1 ableitet. Wenn wir es erreichen wollen, daß 
die x; unabhängige Veränderliche sind, so müssen wir in der Formel (2) eines der Argu- 
mente, zum Beispiel x;, eliminieren. 
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Die Anwendung der SrırLiscschen Formel ergibt: 


n! 
m! Mma!... me! 


= Y2 ann" en Ifpr: on 2 0m, 
A ieam m} ie—mi} i=1 


— V—— ze u.eo (9) 
MyMy mg Fl II m; 


9= mn — 9, m — Om: 
Auf Grund der Abschätzung (3) gilt 


P,(m,, my, . .. , m;) = a a 


(2 n)® = 
dabei ist 


1/1 1 1 
e<alatnt +2): 


My, 


It <x;<b,, so genügen die den x; entsprechenden Werte m; den 
Ungleichungen 


m>np+alnmna=np(! tal, ); 


für alle diese Werte m; gilt also die an 


a<5- EB SE 6) 
et ST At 
np; 


Hieraus ersehen wir, daß, wie auch die Intervalle (a; b;) liegen mögen, die 
Größe © für n—>co gleichmäßig bezüglich x; in diesen Intervallen gegen 
Null strebt. Folglich konvergiert der Faktor e® unter denselben Bedingungen 
gleichmäßig gegen Eins. 

Wir betrachten nun die Größe 


k 
log A, = 0 [m log; 


DER. WEN Palog(t + EL). 
i=1 npi 


Unter den Bedingungen des Satzes lassen sich die Größen x; V = ((<iskh 
; 


bei genügend großen n beliebig klein machen. Wir können daher die Funk- 
tionen log 1 +% \ = )in eine Potenzreihe entwickeln. Beschränken wir uns 


auf die beiden ersten Glieder, so finden wir 


ve Gi v& Gi lqz 1 
1ogl1 1+% - )=2 een el: 


72 II. Eine Folge unabhängiger Versuche 


Die Abschätzung des Restgliedes ist für jedes endliche Intervall der x; gleich- 
mäßig. Also ist 


k 
u Ynde) % ME 1 
a 9 nPı 4 I Ve — +06) 


2 np 
k 
= — Yulnpa 1 Sigi +0 |. 
i=1 2 5 


Da nach der Formel (1) 


k k k k 
Z %zYnp 4 = 2 (m —npı) =2m—nZp= n—n=0 
= i= = i= 

ist, so ist 


log A, = RD 427 +0); 


i=1 


folglich gilt in beliebigen endlichen Intervallen , <z,<b, gleichmäßig 
bezüglich der x, für n — oo die Beziehung 


1 
n u 73257 
Dajıe 0) 
Mm; 
i=1 
Ferner gilt 
V n =) n nPpi 
Mı Mg... Mk nE pı Pa: »- Pr Um 
n 1 
= 1 0— un, (7) 
E 
Rn Pı Pa--- Pk I1(ı 3 
i=1 nPpi 


Unter den Bedingungen des Satzes strebt der zweite Faktor auf der rechten 
Seite dieser Gleichung für n— co gegen 1, und zwar gleichmäßig in jedem 
endlichen Intervall dr z(=1,2,...,k). 

Man sieht leicht, daß durch die Beziehungen (5), (6) und (7) unser Satz 
bewiesen wird. 


Der lokale Grenzwertsatz von Moıvz#-LarLacek. Wenn die Wahr- 
scheinlichkeit für das Auftreten eines Ereignisses A in n unabhängigen Versuchen 
konstant und gleich p(0<p<<1) ist, so genügt die Wahrscheinlichkeit P,(m) 
dafür, daß in diesen Versuchen das Ereignis A genau m-mal eintritt, für n — oo 
der Beziehung 


1 
Ynpgq P,(m) gr a (8) 


und zwar gleichmäßig für alle m, für die sich x in einem endlichen Intervall 
befindet. 
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Beweis. Wie wir schon in der Einleitung zu diesem Paragraphen bemerkten, 
ist der Satz von MoIvke-LArLaor ein Spezialfall des eben bewiesenen Satzes. 
Hier stk=23,,=4,% =1—-9Pı =P 


m=m, m=n—m, ==" —? 
‚=m, =n—m, ven ’ 
Ir»q 

_n—m—ng nr __ 


Setzen wir diese Werte in die Beziehungen (2) ein, so finden wir, daß 
ı —ı pe — R- (E 
2 2 2 
ad A ei 
ist. Diese Beziehung ist offensichtlich mit (8) gleichwertig. 
Wir können nun die Rechnungen in den Beispielen des vorhergehenden 


Paragraphen zu Ende führen. 


Beispiel. Im Beispiel 2 des vorigen Paragraphen war P,(m) für n = 10000, 
m = 40, p = 0,005 zu bestimmen. Nach der eben bewiesenen Formel (8) ist 


P BER 07) 
ne 2 \Yn . 
„(m) er e 2 \Ynpe 


In unserem Beispiel ergibt sich 


Vn p q = V10000 - 0,005 - 0,995 = V49,75 » 7,05 , 


folglich ist 

1 —— 

P,(m —_t 
m) 7,05 Yan 


Die Funktion 
U 
x) = — e 
a) ie 
ist tabuliert; eine kurze Tabelle für die Werte dieser Funktion findet sich am 
Ende des Buches. Aus dieser Tabelle entnehmen wir, daß 
0,1456 
P,(m) = 7.06 = 0,0206 
ist. Eine genaue Berechnung ohne Benutzung des Satzes von MoIVRE-LAPLACE 


ergibt 


P,(m) » 0,0197 . 


Um die Güte der durch den Satz von Moıvre-LarLaoz gelieferten Approxi- 
mationen aufzuzeigen und um die bei seinem Beweis durchgeführten ana- 
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lytischen Operationen geometrisch zu veranschaulichen, betrachten wir ein 
Zahlenbeispiel. 

Die Wahrscheinlichkeit p sei gleich 0,2. In den Tabellen 6 bis 9 sind die 
Werte von m, ="? , der BERDESEHENI SERIEN P,„(m) , der Größen 


npq 
YnpgP,(m) und der Funktion p(x) = 


= e ? mit einer Genauigkeit von 
7 


vier Stellen hinter dem Komma für n—4, 25, 100, 400 zusammengefaßt. 


Yn paq Pu(m) 0,3277 0,3277 0,0205 0,0013 


Tabelle 7 
n = 25 


Tabelle 6 
n—=4 


E27 | Pn(m) |Ynpq Pn{m) 


0 
1 
2 
3 
+ 
5 
6 
7 


0,2420 | >14 


In Abb. 8 stellen die Ordinaten die Werte der Wahrscheinlichkeiten P,(m) für 
verschiedene ganzzahlige Werte der Abszisse m dar. Aus der Zeichnung er- 
kennt man, daß die Größen P,(m) mit wachsendem n gleichmäßig fallen. 
Damit nicht in der Zeichnung die Punkte [m, P,(m)] schon für die betrach- 
teten Werte n mit der Abszissenachse praktisch zusammenfallen, wählen wir 
auf den Koordinatenachsen ganz verschiedene Maßstäbe. 

ne man Sion der Abszissen m und der Ordinaten P,(m) die Ab- 


szissen 7, = "ZZ? und die Ordinaten y„(m) = Ynpgq P,(m), so bedeutet dies 


Var 
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Tabelle 8 
n = 100 


SIERLEIGESEIESENE: 


0,0271 
0,0310 
0,0349 
0,0385 
0,0419 
0,0447 
0,0471 
0,0487 
0,0497 
0,0498 


0,0034 
0,0051 
0,0076 
0,0100 
0,0156 
0,0218 
0,0298 
0,0399 
0,0526 
0,0679 
0,0862 
0,1075 
0.1316 
0,1583 
0,1871 
0,2175 
0,2484 
0,2790 
0,3081 
0,3349 
0,3580 
0,3766 
0,3899 
0,3973 
0,3986 


0,0044 | 
0,0064 | 
0,0091 
0,0127 
0,0175 
0,0238 
0,0317 
0,0417 
0,0540 
0,0684 
0,0862 
0,1065 
0,1295 
0,1550 
0,1827 
0,2119 
0,2420 
0,2721 
0,3011 
0,3282 
0,3521 
0,3719 
0,3867 
0,3957 
0,3989 


0,0946 
0,0849 
0,0720 
0,0577 
0,0439 
00316 
0,0217 
0,0141 
0,0088 
0,0052 
0,0029 
0,0016 


Yrpg Pulm) 


0,3936 
0,3828 
0,3667 
0,3460 
0,3215 
0,2944 
0,2656 
0,2362 
0,2070 
0,1788 
0,1523 
0,1279 
0,1059 
0,0865 
0,0696 
0,0553 
0,0433 
0,0355 
0,0255 
0,0192 
0,0143 
0,0105 
0,0075 
0,0054 


75 


nenn. N*400 


Abb. 9 
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1, eine Verschiebung des Koordinatenursprungs in den Punkt (np, 0), der in 
der Nähe der maximalen Ordinate von P,(m) liegt, 2. eine Vergrößerung der 
Maßeinheit auf der Abszissenachse um den Faktor Yn p q (mit anderen Worten 
eine Zusammenstauchung der Zeichnung auf den Abszissenachsen um den 
Faktor Yn pg), 3. eine Verkleinerung der Maßeinheit auf der Ordinatenachse 
um den Faktor yn p g, d. h. eine Streckung der Zeichnung längs der Ordinaten- 
achse um den Faktor Ynpg. 

In den Abb. 9a, b, c sind die Kurve y = p(x).und die in der eben beschrie- 
benen Weise transformierten Punkte [m, P,(m)], d.h. die Punkte [x,, y„(m)] 
dargestellt. Wir sehen, daß schon für n = 25 die Punkte [x,, y„(m)] in der 
Zeichnung nahe an den entsprechenden Punkt der Kurve y = p(x) liegen. 
Diese Annäherung wird noch besser für Werte von n, die größer als 25 sind. 

Um eine anschauliche Vorstellung davon zu bekommen, in welchem Maße 
die asymptotische Formel von MorvRE-LAPLace für endliche n anwendbar ist, 
d. h., inwieweit man das Binomialgesetz für die Berechnung der Wahrschein- 
lichkeiten P,„(m) durch die Funktion y=g(x) ersetzen in bringen wir 
noch ein Beispiel. 

Der Einfachheit halber betrachten wir den Fall p=q u} U und nehmen 


nur solche n, für die der Wert x,(m) = 1 möglich ist; solche n a z.B. die 
Zahlen n = 25, 100, 400, 1165; für sie ist nämlich x,(m) = 1 für m = 15, 55, 
210, 595. 

Wir setzen zur Abkürzung 


P,(m) = 


und ’ a: =. (m) 
2 


rrerl = On 
fürp=gq = und (m) =1. 
Auf Grund des lokalen Grenzwertsatzes von MoIvRE-LArLACE muß der Quo- 
tient Ze gegen Eins streben. Die Rechnung ergibt für die eben genannten 


n 
Werte von n. 
Tabelle 10 


0,09742 0,09679 


0,04847 0,04839 
0,024207 0,024194 
0,014236 0,014234 


I) Sehr genaue Abschätzungen des Restgliedes findet man in der Arbeit von 8.N. 
BERNSTEIN, Rückkehr zu der Frage der Genauigkeit der Larnaczschen Grenzwertformel, 
Izv. Ak. Nauk SSSR 7(1943). 
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$ 13. Der Integralgrenzwertsatz 


Den soeben abgeleiteten lokalen Grenzwertsatz benutzen wir zur Ableitung 
einer weiteren Limesbeziehung der Wahrscheinlichkeitsrechnung, des Integral- 
grenzwertsatzes. Wir beginnen mit einem einfachen Spezialfall dieses Satzes 
— dem Integralsatz von MoIVRE-LAPLACE. 


Der Integralsatz von MoıvrE-LArLace. Ist u die Anzahl des Eintretens 
eines Ereignisses in n unabhängigen Versuchen, wobei bei jedem dieser Versuche 
die Wahrscheinlichkeit dieses Ereignisses gleich p ist (0<p< 1), so gilt gleich- 
mäßig bezüglich a und b (-o <sa<b<-+o) für n—oo die Beziehung 


b Fi 
Pfa<tur <> I er 


Beweis. Wir setzen zur Abkürzung 
P,(a, b) = Pia AR ı. 
Yrpa 


Diese Wahrscheinlichkeit ist offenbar gleich der Summe $; P,(m), erstreckt 


über alle Werte m mit a< x, < b, wobei 7, = en 
npqg 


Wie definieren nun eine Funktion y = I/,(x) folgendermaßen: 


gesetzt ist. 


0 für 2<2, =— rn 
ze 
= II,(x) = 0 für > 2,4 —— ee, 
ET Ira 
np q P,(m) für, <<, ulm=0,1,:..,n). 


Die Wahrscheinlichkeit P,(m) ist dann offenbar gleich dem von der Kurve 
y=II,(z), der x-Achse und den Ordinaten in den Punkten x=x, und 
x = 2.1 begrenzten Flächeninhalt, d.h. 

Zm+1 


P,(m) = Yn p q P,(m) (any — in) = S Ile) dx. 


Hieraus folgt, daß die gesuchte Wahrscheinlichkeit P,(a, b) gleich der zwi- 


schen der Kurve y = IT,(x), der x-Achse und den Ordinaten in den Punkten xm 
und x, eingeschlossenen Fläche ist, wobei m und m durch die Ungleichungen 
a<ı, <a+ - ‚ bsı-.<b+ - 


Yrpq Ei Ynpq 


bestimmt sind. Also ist 


P,(a, b) = -I.(0) an = SILd0) de + FIn40) de— FI. 
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Da der maximale Wert der Wahrscheinlichkeit P,(m) auf den Wert m, = 
[(n + 1)p] fällt, so tritt der maximale Wert von //„(x) in dem Intervall 


DEZE u RUFEN a 


Yn pa Vrpa ferr 


auf. In diesem Intervall gilt der lokale Grenzwertsatz von MOIVRE-LAPLACE. 
Für alle hinreichend großen Werte von n gilt Ge 


max //,(x) < 2 —_maxe ’-)% j 
Yer 
Hieraus gewinnen wir insbesondere die Beziehung 


Im 
< | max /],(z) dx 


lon| = Fin) de — Ri IT,(@) da 


+f max /],(x) dx < V= —b+. +m—a)<2 en 


folglich ist 
lim ,=90. 


Nn— 080 


P,(a, b) unterscheidet sich also nur um eine unendlich kleine Größe von 
b 
ST) dx. 
a 


Wir setzen zunächst voraus, daß a und b endliche Zahlen seien. Unter dieser 
Voraussetzung ergibt sich aus dem lokalen Grenzwertsatz für a<xz, <b die 
Gleichung 


TI, (&) — = E® 1 + %()] D 


Y2 x 


wobei a,(2,) für n — oo gleichmäßig bezüglich x, gegen Null strebt. Offen- 
bar ist auch für alle Zwischenwerte des Arguments 


IT, n(&) m 


Er Fa EBEN 


wobei im max a,„(z) = 0 ist. Bei beliebigem m erhalten wir nämlich im 
n>w a<e<b 
Intervall x, <x < 2,4, die Beziehung 


ld“ 


1 + onlem)] ; 


II,Q@) = II,(&n) = 2» e 


Ver 


2 
t—zm 


Alt) = € Eu a) +11 —1. 


dabei ist 
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max (a), 1) 


rg 


En | 
Ta <a e—m| < 


ist, findet man sofort die Beziehung 


lim max o,(@)=0. 
n>wa<z<b 


Faßt man alle gefundenen Abschätzungen zusammen, so erhält man die Be- 
ziehung 


i.f-% 
P,(a,b) = — |e ?dr+ R, 
(a ) = | + 
“ 
mit 
ı f-% 
= — |e ?o,(a) de +. 
| &u(x) +e 
@ 
Auf Grund der Ungleichung 
b 
=! 
1 —— 
R, <max z)|- — Je ?de+ 
er == | er 
a 


sieht man sofort, daß 


lim R,=0 
N 00 
gilt. Unter der im Verlauf des Beweises zusätzlich gemachten Voraussetzung 
haben wir also den Satz bewiesen. Wir müssen uns nun noch von dieser Be- 
schränkung befreien. 
Dazu bemerken wir zunächst, daß!) 


2d=1 

y2r | 

ist. Daher kann man zu beliebigem e > 0 ein hinreichend großes A so wählen, 
daß 


—— [>50 i-2 
Ya |‘ = 


m, 
z r_® 
Ik e ?de<— 


m? Pr, 


!) Sind die Integrationsgrenzen im folgenden, wie hier, nicht besonders angegeben, so 
soll die Integration von — oo bis + oo erstreckt werden. 
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ist. Ferner wählen wir entsprechend dem bereits bewiesenen Teil des Satzes 
ein hinreichend großes n, so daß für— A<a<b<A 


1 =y € 
P,&a,b)— —- le ?di<_—_ 
a 
gilt. Dann ist offenbar 
P,—4A,A)>1 _ 


P(—00,— 4A) + P(A,+0)=1—P(-A,A)<-. 
Wir beweisen nun, daß für beliebiges aunddb (wo <a<b<-+o) 


ı » 
Pal [e #ie <e 
a 


wird; damit ist dann auch der Beweis des LarLaczschen Satzes abgeschlossen. 

Dazu müssen wir einzeln die verschiedenen möglichen Lagen der Punkte a 
und b bezüglich des Intervalls (— A, A) auf der Geraden umtersuchen. Nehmen 
wir z.B. den Fall a<— A,b>A (die übrigen Fälle überlassen wir dem 
Leser). In diesem Falle ist 


a SIE! 


—i A 
P,(a, b) = P,(a, bp A) + Pu— A, A) = P(A, b) . 
Daher gilt 


Pe) | R 
P,(a, 9 je < <| ra | e ®dz 


zi , 2 
PA, Nr IE a ea 
—A 


<P, a4 [ee 


4A 2 o Pr 
1 — — 
+ | Pu — A, A) — IE 2 dz| + P„(A, ++ ee 2 dz 
\ J Ver 


e € € E 
Br En ne u St 
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Wir kommen nun zur Ableitung des Integralgrenzwertsatzes für den allgemeinen 
Fall des Schemas einer Folge von unabhängigen Versuchen. Wie früher bezeichnen 

m (i=1,2,...,k) die Anzahl des Eintretens der Ereignisse As =1,2,...,n) in 
n a "tolgenden Versuchen. In Abhängigkeit vom Zufall können die Zahlen ki 
nur die Werte 0,1,2,...,”n annehmen; da in jedem Versuch nur k Ereignisse möglich 
und diese Ereignisse unvereinbar sind, muß die Gleichung 


Aırtattamn ) 


bestehen. Wir sehen nun die Größen it, 4a, . - - , #4; als rechtwinklige Koordinaten eines 
Punktes in einem k-dimensionalen euklidischen Raum an. 

Die Resultate der n Versuche lassen sich daher durch einen Punkt mit ganzzahligen 
Koordinaten, die zwischen 0 und n liegen, darstellen; solche Punkte wollen wir im, folgen- 
genden ganzzahlig nennen. Die Gleichung (1) zeigt, daß sich die Versuchsergebnisse nicht 


> 


7 


IL —11,030) 


Abb. 10 


durch beliebige ganzzahlige Punkte im Hyperkubus 0<w;<nr(i=1,2,...,k) dar- 
stellen lassen, sondern nur durch solche, die sich auf der Hyperebene (1) befinden. In 
Abb. 10 ist die Lage der möglichen Versuchsergebnisse in der Hyperebene (1) für den 
Falln = 3, k = 3 eingezeichnet. 

Wir führen nun eine Koordinatentransformation mit Hilfe der Formel 


u HER u 1,2..,Bka=-1—p) 


Yr pi gi 


durch. Die Gleichung der Hyperebene (1) schreibt sich in den neuen Koordinaten in der 
folgenden Form: 


k 
2 ®i np =0. (2) 


Die Punkte der Hyperebene (2), in welche die ganzzahligen Punkte der Hyperebene (1) 
übergehen, wollen wir ebenfalls „ganzzahlig‘“ nennen. 


$13. Der Integralgrenzwertsatz 83 


Wir bezeichnen mit P,„(G) die Wahrscheinlichkeit dafür, daß im Resultat von n Ver- 
suchen die Anzahl 2; #=1,2,...,%k) des Eintretens eines jeden der möglichen Ergeb- 
nisse so beschaffen ist, daß der Punkt mit den Koordinaten 


MRPi 


%G=- 
yrpigi 
in das Gebiet @ fällt. 

Es gilt dann der folgende 

Satz. Wenn in dem Schema einer Folge unabhängiger Versuche, wobei in jedem Versuch 
nur k verschiedene Ergebnisse möglich sind, die Wahrscheinlichkeit eines jeden Ergebnisses 
von der Nummer des Versuchs nicht abhängt und von 0 und 1 verschieden ist, so gilt für 
jedes Gebiet @ der Hyperfläche (2), für das der (k — 1)-dimensionale Inhalt seiner Berandung 
gleich Null ist, gleichmäßig bezüglich G für n— oo die Beziehung 


lyıa 
ME 2 | aut, 
am ynmi 
je 


dabei bezeichnet dv das Volumenelement des Gebietes Q, und das Integral wird über das Gebiet @ 
erstreckt. 


Beweis. Der Beweis ist sowohl der Idee nach, wie auch in der Durchführung fast voll- 
ständig eine Wiederholung aller beim Beweis des Integralsatzes von MoıvRE-LAPLAOE ange- 
stellten Überlegungen. Wir können uns daher auf eine kurze Darstellung beschränken und 
überlassen dem Leser die Ausführung des Beweises in allen Einzelheiten. Wir beginnen mit 
der Durchführung zweier elementarer Berechnungen. Zunächst suchen wir die Anzahl $;(n) 
aller möglichen Ergebnisse von n Versuchen, wobei in jedem von diesen Versuchen k un- 
vereinbare Ergebnisse eintreten können. 

Die Zahlen $,(n) genügen der Beziehung!) 


n 
Syn) = 2, Sr—ı(r). (3) 
= 


Diese Gleichung besagt nämlich, daß das Ereignis A, z. B. (n—r)-mal auftreten kann 
(0 <n—r<n); in einem solchen Falle kann man sich für die übrigen k — 1 Ereignisse 
S%—ı(r) Ergebnisse denken. Da für verschiedene r diese Ergebnisse verschieden sind, ergibt 
sich hieraus gerade die Gleichung (3). Für das BerxouLnısche Schema (k = 2) ist 


S,(n) =n + 1, 
daher erhalten wir für k = 3 
in (n +1)(n +2) 
S; = ia SH ee SE. 
sin) = Dr+ 1) nn 
Diese Gleichung weist schon darauf hin, daß die Formel für $;(r) die folgende Gestalt 
haben wird: 


_ + Dm+ N: mtk—D)_gn 
Sr{n) — uns: 7eS T ugeaunen On+k—1' (4) 


Wir nehmen an, diese Gleichung sei bereits für alle k < N bewiesen und zeigen, daß 
sie dann auch für k= N + 1 richtig ist, d. h., daß die Gleichung 


n n r n 
Sn+ıln) = % Sylt) = 3 Or+n—ı = Cn+N 
r=0 r=0 


!) Ein anderer Beweis ergibt sich aus den Überlegungen von Seite 25. 
7  Gnedenko 
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besteht. Letztere Behauptung ergibt sich aus der folgenden leicht nachzuprüfenden K. 
von Gleichungen: prüf tie 
EM M+Da+n arm 


n! N)! N 
_ an +D--.(m+N—ı]) „rot a+N—l) 
u M (N—1) 


BE 1 
= On tr Can 
1 n—2) 
= Gırfat Hirt (0 a 
n 
ee, 
r=0 


qg.0.d. 
Wir brauchen ferner die Größe des (k — 1)-dimensionalen Volumens des durch die 


Ungleichungen 
— 1/22 << |]? oO k=12...,H 
% Pi 


festgelegten Teils der Hyperebene (2). In diesem Gebiet der Hyperebene (2) sind alle 
„ganzzahligen“ Punkte enthalten, die Versuchsergebnisse darstellen. Dieses Volumen 
ist — wie der Leser leicht durch Integration nachprüft — gleich 


[ 
en mi zpr% 
kn! 5 f 
( I 94 
i=1 


Wir setzen nun wieder x; = u u =1,2,...,k), m; sind dabei ganze Zahlen. 
Yr iq: 

Dann ordnen wir den Punkten (2,2%, ...,%;) der Hyperebene (2) disjunkte Parallel- 
epipeda zu, die diese Punkte enthalten, und deren Ecken in den Mittelpunkten der 
„ganzzahligen Parallelepipeda‘“ liegen, die die gegebenen ganzzahligen Punkte umgeben 
[in Abb. 10 ist eines dieser Gebiete, um den Punkt (1, 1, 1), gestrichelt]. 

Alle diese Gebiete haben ein und dasselbe Volumen dv, in ihrer Summe ergeben sie 
das Volumen v’, das etwas größer!) als v ist. Man sieht jedoch leicht, daß für n— oo der 


Quotient jr. gegen 1 strebt. Daher ist 


v® 
dv = FF + o(1)] . 
Man sieht leicht, daß für n-> oo das Volumen dv wie —— gegen Null strebt. 
nk—ı 


Wir definieren nun in jedem Punkte der Hyperebene (2) folgendermaßen eine Funk- 
tion (2, %y...,2%): In jedem „ganzzahligen“ Punkte (x,%,...,2;) und dem um- 
gebenden Gebiet setzen wir 


1 
AI Zy .. 5 n) = Palmu Ma...» ma) 


d 
1 k 
ZI ie +1) Eat % 
—i- = Palm... my) [1 + 0(l)]. 
nk—1 3 Pig er B 


1) Denn die Gebiete, die die „ganzzahligen“ Punkte auf dem Rande umgeben, ragen 
über das Volumen v hinaus. 
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Außerhalb der erwähnten Gebiete sei 
Ur 2.42) = 0. 


Wir wollen nun die Werte der Funktion x(x,, 23, ...,2;) auf den Loten zur Hyperebene 
in den Punkten (z,, 23, . . . , 27) in Richtung des Teils des Raumes abtragen, in dem 

Zz4 Ynı pi gi > 0 ist. Geometrisch stellt die so konstruierte Funktion eine treppenförmige 
Hyperfläche dar. Das k-dimensionale Volumen, das durch die Hyperebene und die Hyper- 
fläche begrenzt wird, ist gleich 


Er, u... dv Z Palm Ma ...;mı) =1. 
Die Wahrscheinlichkeit P(G) dafür, daß ein Versuchsergebnis in das Gebiet @ fällt, ist 


offenbar gleich 
P(@)= % Palm Ma... , My); 
tie 
die Summe wird dabei über alle im Gebiet @ befindlichen „ganzzahligen‘ Punkte erstreckt. 
Wir schreiben nun P(@) in der Form 
P(G) = > Ted, X 2», 2;) dv 
(2) @ 
und bemerken, daß die gesuchte Wahrscheinlichkeit fast gleich dem Volumen des Zylin- 
ders ist, der einerseits durch die Hyperebene (2), andererseits durch die Hyperfläche 
7X %g - -., 2) und die durch die Begrenzung des Gebietes G senkrecht zur Hyperebene (2) 
verlaufenden Erzeugenden begrenzt wird. Der Unterschied zwischen den beiden Größen 
ist gleich |@, — Bal» &, bezeichnet dabei die Summe der Volumina, die sich über den zu @ 
gehörenden Teilen der Gebiete befinden, die nicht zu @ gehörige ganzzahlige Punkte 
umgeben, f, ist die Summe der Volumina, die sich über den nicht zu @ gehörigen Teilen 
der Gebiete befinden, die in G gelegene ganzzahlige Punkte umgeben. 
Wir setzen nun voraus, daß das Gebiet @ ganz in einem beschränkten Teil der Hyper- 
ebene (2) gelegen und daß seine Begrenzung eine integrierbare (k — 2)-dimensionale Fläche 
ist. Nach dem lokalen Grenzwertsatz ist unter diesen Bedingungen 


zug 
» Kı) = Il 
"b V2@rn)k1p, pr" Pr EN 


k—1 » 1 .x2 

91 92°" #\ 5202 
— [/ A" "26 II 1+__ 1+7,); 5 
Ver 2:. FR | € =) : er e 


dabei strebt y, = y(zj, 2, ... ,‚2g) gleichmäßig für alle Punkte des Gebietes @ für n— oo 
gegen Null. Es ist also 


Ar ip: 


-g2 gi ir k—1 i 
ra = Ya — [It ++ rar —an + Pa. (6) 
pi (aa Im 


I19a°*"% 


Auf Grund der Wahl der die ganzzahligen Punkte umgebenden Gebiete kann die Größe 
an — Pa| nicht größer werden als das Volumen, das sich über den Gebieten befindet, 
die gemeinsame Punkte mit der Begrenzung des Gebietes @ haben. Dieses Volumen über- 
steigt nicht das Produkt des (k — 2)-dimensionalen Volumens der Begrenzung von @ (wir 
wollen es mit dem Buchstaben « bezeichnen) mit dem doppelten Durchmesser des Ge- 
bietes, das einen „ganzzahligen“ Punkt der Ebene (2) umgibt, und dem maximalen 
Wert der Funktion (x, 23 ...,2%,). Auf Grund von (5) wird der maximale Wert von 


7* 
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7%, Xp »..,%;) für hinreichend große Werte n nicht größer als 


a 
2n(0,0,...,0)=2 || ——-— ——— , 
Zr) i5 pi 


Der größte Durchmesser der Gebiete, welche die ganzzahligen Punkte umgeben, übertrifft 
nicht den größten Abstand zwischen zwei benachbarten ganzzahligen Punkten und ist 
demnach nicht größer als 


3a 
Fr a 2 


len Anl< su ]/ be _ 5 RE 


era pn Ya 


Somit ist 


und damit für n— x. 


a — Bn|> 0. (7) 
Nach Definition des mehrdimensionalen Integrals gilt für n— 
zu . 1 
Da re a 
[i _Z&Pi n FRE a) (2 FOE»ETN = gi 
I1 92 * + 
Die Differenz 
1 
eur 


PET (2rn)k-ı il 
9192 *"9£ 


k 5 
P(G) Eure Een u = — nt 3]|H( + +) 


k ; er zur 
++) —— ©) 
i=1 | | Em (An-ı 
ER Be 
strebt für n— oo gegen Null, da für n-> oo außer der Beziehung (7) auch die Beziehungen 


Ilo+S) 


i=1 


< 2* max |y,|— 0 


und 
2 i 
a +4)-1=0 
4 n 


bestehen. Die Beziehungen (6), (8), (9) beweisen den Satz für den Fall eines beschränkten 
Gebietes mit integrierbarer Berandung. Für unbeschränkte Flächen führen wir folgende 
Überlegung durch. Es sei e > O eine beliebige Zahl. Wir beschreiben um den Koordinaten- 
ursprung in der Hyperebene (2) eine (k — 1)-dimensionale Kugel $ von so großem Radius R, 


daß 
1 
Hark —5Lur & 
„An U 5 3 En (10) 
| Versen 4 


(8) 
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ist.!) Auf Grund des eben bewiesenen Satzes ist für hinreichend große n 
Pu) >1— 110‘) 


Sei nun G ein unbeschränktes Gebiet mit einer in jedem endlichen Teil der Hyperebene (2) 
integrierbaren Berandung. Wir zerlegen das Gebiet G in zwei Gebiete — in das in bezug 
auf die Kugel $ innere (G,) und äußere (G,); es ist klar, daß 


P(@) = P(@,) + P(@,) 


ist. Auf Grund von (9) und (10) können wir bei beliebigem e > 0 ein hinreichend großes R 
so wählen, daß für alle hinreichend großen n 


1 
ur; e 
er Ness ° ir: er 


ist. Außerdem ist — wie Aka bewiesen wurde — für genügend große n 


P(G FR -zZu , & 12 
_ —-_ € ul< — 
”- [ CE =5>7777 Fa er 
Da e > 0 beliebig war, beweisen die Ungleichungen (11) und (12) unseren Satz vollständig. 

Bemerkung, Dem eben bewiesenen Satz haben wir eine Form gegeben, in der alle 
Veränderlichen &,, 23, ... , 2; die gleiche Rolle spielen. 

In dem Integralsatz von MoIVRE-LAPLACE zogen wir es jedoch vor, die Überlegungen 
nur mit der Veränderlichen x = x, durchzuführen, indem wir die Gleichartigkeit der Ver- 
änderlichen x, und x, zerstörten. Geometrisch bedeutet dies, daß wir nicht die Versuchs- 
ergebnisse selbst (die ganzzahligen Punkte auf der Geraden x, + x, = 0), sondern ihre Pro- 
jektionen auf die «-Achse betrachteten. Ähnlich können wir durch Zerstörung der Gleich- 
artigkeit im allgemeinen Fall die Integration nicht über das Gebiet G, sondern über dessen 
Projektion G’ auf irgendeine Koordinatenhyperebene, sagen auf die die Ebene x, = (0, 
betrachten. Das Volumenelement dv’ in der Hyperebene x; = 0 hängt mit dem Volumen- 
element dv der Hyperebene (2) durch die Beziehung 


dv’ = dv cos 


zusammen, ist dabei der Winkel zwischen den erwähnten Hyperebenen. Man rechnet 


leicht aus, daß 
cos [1 = NPr ae _ 
Vz Pig: 
ist. In der Koordinatenhyperebene ist ein Volumenelement dv’ = dx, dx, ..... dx 1, daher 


gilt nun die Gleichung 
k 


1 
91 92°" "9% -:2: i u FE Ga m .. 14 a 
Rz pg u (2n)-1 pr 


Im Integranden müssen wir x; durch die Variablen x,, 23, . . . , x —ı ausdrücken: 


k—1 
1 
Ypi 2%. 
Vor 4% 2 zu 


1) Diese Bedingung läßt sich verwirklichen, weil das aufgeschriebene Integral, genommen 
über den ganzen Raum, gleich 1 ist. 


= — 
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Nach dieser Substitution erhalten wir: 


Yar- Salı +2). +2 B a ERBE — Oma. ni). (13) 


i=1 1Si<jse— 


Der Integralgrenzwertisatz läßt sich daher auch anders formulieren, nämlich: 
Unter den Bedingungen des Integralgrenzwertsatzes strebt für n — oo 


1 
=: ME A.) 
k—1 
N: un |. i da, da. .da-. “. 

fe 


Es ist klar, daß der Integralsatz von Moivre-LArLAoe ein Spezialfall des eben bewiesenen 
Satzes ist: Man kann ihn leicht aus der Formel (14) erhalten. 

Dazu braucht man nur zu bemerken, daß im Bernourtischen Schema k=2,p =p, 
ga=-n-1— pi. 

Für k = 3 nimmt die Formel (14) folgende Gestalt an: 


mar [ tn 


mit 
PB =1—-Mm—P» 


ma! +2) ıt% (1 an 2492 Yılırada „., 
3 3 


Ps 
-Ih(zı22+2 PıPa „ 
Ps ( : ; 9ı 9a £ 


Eine einfache Rechnung liefert 
R=1—-p—m=Ihı9—PıPa)» 


az) = ——[#+ arıyaz =.) 
ı — PıPa 91 4a 


9ı 9 


daher ist 
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Als erste Anwendung des Integralsatzes von MoIvre-LArLace schätzen wir 
die Wahrscheinlichkeit der Ungleichung 


M__ 
er pl<e 
ab, wobei & > 0 konstant sei. 
Es ist 
** pq rn 71 


!) In der Tat, wgen +, =lundy +9 =1 ergibt sich: 1, —n; = —Ps 
= (ılP +) — Pe (Pı +) = 9a —PaPs- 
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und auf Grund des Integralsatzes von Morvee-Lartacz erhalten wir 


2’ 
lim PIIE—p|<es!= e ?dk=1. 
n>%0 n 


Für jedes konstante e > 0 strebt also die Wahrscheinlichkeit der Ungleichung 

7 
io 

Dieser Tatbestand wurde zuerst von J. BERNOULLI entdeckt; er heißt Gesetz 
der großen Zahlen oder Satz von BernouLuı. Der Satz von BERnouLLı und 
seine zahlreichen Verallgemeinerungen gehören zu den wichtigsten Sätzen 
der Wahrscheinlichkeitsrechnung. Auf ihnen beruhen alle Erfolge bei der 
Anwendung der Wahrscheinlichkeitsrechnung auf die verschiedensten Probleme 
der Naturwissenschaft und der Technik. Darüber wird in dem Kapitel, das dem 
Gesetz der großen Zahlen gewidmet ist, mehr zu sagen sein; dort geben wir 
auch einen Beweis des BERNouLLIschen Satzes durch eine einfachere Methode 
an, die sich sowohl von der eben entwickelten, wie auch von der von J. Ber- 
NOULLI benutzten Methode unterscheidet. 

Wir betrachten nun einige typische Aufgaben, in denen der Satz von MoıIvsr- 
LarLace zur Anwendung gelangt. 

Es werden n unabhängige Versuche ausgeführt, bei jedem von ihnen sei die 
Wahrscheinlichkeit für das Auftreten eines Ereignisses A gleich p. 


< e gegen Eins. 


I. Gefragt ist nach der Wahrscheinlichkeit dafür, daß die relative Häufig- 
keit des Auftretens von A von der Wahrscheinlichkeit p um nicht mehr als & 
abweicht. Diese Wahrscheinlichkeit ist gleich 


Het 


II. Wieviele Versuche muß man mindestens ausführen, damit mit einer 
Wahrscheinlichkeit, die nicht kleiner als ist, die relative Häufigkeit von 
der Wahrscheinlichkeit um nicht mehr als « abweicht? Wir müssen n aus der 
Ungleichung 


Er 


bestimmen. Die auf der linken Seite der Ungleichung auftretende Wahrschein- 
lichkeit ersetzen wir näherungsweise nach dem Morvre-LarLaczschen Satz 
durch ein Integral. Zur Bestimmung von n erhält man schließlich die Un- 


<al>B 
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gleichung 


y2r — 
III. Bei vorgegebener Wahrscheinlichkeit ß und gegebener Anzahl von 


Versuchen n sind die Grenzen für die möglichen Differenzen E— p| zu bestim- 


men. Mit anderen Worten, wenn 8 und n bekannt sind, so ist ein a gesucht, 
für das 


leader 


gilt. Die Anwendung des LarLAaczschen Integralsatzes ergibt zur Bestimmung 
von & die Gleichung 


Die numerische Lösung aller betrachteten Aufgaben erfordert die Berechnung 


des Integrals 
2 z’ 
2 


Su) =—_-|e Far (ı) 


für beliebige Werte von x sowie die Lösung der umgekehrten Aufgabe — der 
Berechnung des entsprechenden Argumentes x bei Kenntnis von (x). Für 
diese Rechnungen braucht man Spezialtabellen, da sich das Integral (1) für 
0<x2<<oo nicht in geschlossener Form durch elementare Funktionen aus- 
drücken läßt. Derartige Tabellen gibt es und sind am Ende unseres Buches 
zu finden. 

Abb. 11 vermittelt eine anschauliche Vorstellung vom Verlauf der Funktion 
©(z). Mit Hilfe einer Wertetabelle für ®(x) kann man nach der Formel J(a, b) 
= Ö(b) — D(a) auch das Integral 

b 
J(a,b) = e ? dr 


Be 


berechnen. Die Tafel der Funktion (x) enthält nur Werte für positive x; 
für negative x ermittelt man ®(x) aus der Gleichung 


d(— ı) = — le). 


Wir sind nun in der Lage, die Lösung des Beispiels 1, $ 11, zu Ende zu führen. 
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Beispiel 1. Im Beispiel 1, $11, war die Wahrscheinlichkeit 
p=ZP{u=m} 
gesucht. Dabei wird die Summe über alle Werte m erstreckt, für die 
Im — 2,7 : 10%] > 2,7 - 1012, 


die Anzahl der Versuche betrug dabei n = 5,4: 10%, und es war p =ı. 


Da 
p=P B— et ES u Ferne ui Ba ur m > 233.10) 


Yrpg ++ 1093::%. Yapaq 


r 


y y:5 


Abb. 11 


ist, so ergibt sich auf Grund des Lartaczschen Satzes 


x 
2.0.9 e ?dx 
y2r 
2,33 -10 
Wegen 
oo 
ba 1 ae ER 
IE 2de<—_|xe ?de=-e ? 
z % 
z z 
ist 
p< 1 e 27.100 — 10-100 , 
2r .-10 


Wie klein diese Wahrscheinlichkeit ist, mag man aus dem folgenden Vergleich 
entnehmen. Stellen wir uns vor, daß in eine Kugel vom Radius 6000 km, die 
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mit weißem Sand angefüllt sei, ein einziges schwarzes Sandkorn gefallen sei. 
Die Größe der Sandkörner sei gleich 1mm?. Dann greife man auf gut Glück 
aus dieser ganzen Masse ein Sandkorn heraus; wie groß ist die Wahrschein- 
lichkeit dafür, daß dieses Sandkorn schwarz aussieht ? 

Man rechnet leicht nach, daß das Volumen einer Kugel vom Radius 6000 km 
etwas kleiner als 10% mm? ist, folgiich ist die Wahrscheinlichkeit dafür, daß 
man das schwarze Sandkorn herausgreift um weniges größer als 10%, 


Beispiel 2. Im Beispiel 2, $ 11, war die Wahrscheinlichkeit dafür zu be- 
stimmen, daß die Anzahl der fehlerhaften Erzeugnisse nicht größer als 70 ist, 
wenn die Wahrscheinlichkeit dafür, daß ein Produkt fehlerhaft ist, gleich 
p = 0,005 und die Anzahl aller Produkte gleich 10000 ist. Nach dem eben 
bewiesenen Satz ist diese Wahrscheinlichkeit gleich 


Pu<m}=P|- 1 it Finn N 


Y49,75 “ Ynpa 49,75 


„84 2 
= P|- 7,0 u Een |« 
.09 


Yn »q 2 n 
= ©(2,84) — 8(— 7,09) = ©(2,84) + (7,09) = 0,9975 . 


Der Wert der Funktion ®(x) für x = 7,09 steht nicht mehr in der Tabelle, 


wir ersetzen ihn durch - und begehen dabei einen Fehler, der kleiner als 10° 
ist. = 

Natürlich ist in den Beispielen dieses und des vorigen $ ebenso wie in allen 
anderen Aufgaben, in denen bei der Bestimmung der Wahrscheinlichkeiten 
P,(m) für endliche m und n die asymptotischen Formeln von MoIVRE-LAPLAOE 
benutzt werden, eine Abschätzung des dabei begangenen Fehlers erforderlich. 
Lange Zeit wurden die Sätze von MoIvrRE-LArLAce auf die Lösung ähnlicher 
Aufgaben ohne irgendwelche befriedigende Abschätzung des Restgliedes an- 
gewendet. Man verschaffte sich nur rein empirisch Gewißheit darüber, daß 
für n von der Ordnung einiger Hunderte oder noch größer, sowie für p, die nicht 
zu nahe an O0 oder 1 liegen, die Benutzung der Sätze von MoIvRE-LAPLACE 
zu befriedigenden Ergebnissen führt. Heutzutage gibt es jedoch hinreichend 
genaue Abschätzungen der Fehler, die man bei Benutzung der asymptotischen 
Formel von MoIvre-LArLacz begeht.!) 

Wir verweilen noch etwas bei der Verallgemeinerung des Satzes von BER- 
NouLLı auf das allgemeine Schema einer Folge unabhängiger Versuche. In 
jedem Versuch seien k verschiedene Ergebnisse möglich, ihre Wahrscheinlich- 
keiten seien in jedem Versuch gleich P}, Pa - - - » Pr; U» Hp - - - ‚4, geben an, 
wie oft die einzelnen Ergebnisse in einer Folge von n unabhängigen Versuchen 
aufgetreten sind. Wir bestimmen die Wahrscheinlichkeit für das gleichzeitige 


1) Siehe z. B. die auf Seite 77 zitierte Arbeit von $S. N. BERNSTEIN. 
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Bestehen der Ungleichungen 


<< Ey ...5 <'&, (2) 


[2 
= Pı 


d.h. der Ungleichungen 


n n n 
we —— , Re . 2a. <eE —— | 
” Von ka Von Il Vin 


Die letzte dieser Ungleichungen ist eigentlich eine Folgerung aus den vorher- 
gehenden, da nach (2), $13, die ersten k— 1 Ungleichungen aus (2) die Ab- 


schätzung 
k—1 
Pi gi 
|< ZZ. 3 
<> Ve (8) 


ergeben. Nach (14), $13, besitzt die Wahrscheinlichkeit der ersten k—1 
Ungleichungen aus (2) [und somit auch der Ungleichung (3)] als Grenzwert 
für n — oo das Integral 


1 
I19a---9—1 | ,,, 5 zu...) _ 
Arip | IE dan. da... .din—ı =1. 


<ä> PrÜzBet.;. 


S 1 /a 
x.| = I— Pidi 
Izi = ma 
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Wir sahen beim Beweis des lokalen Grenzwertsatzes von MOIVRE-LAPLACE, 
daß die asymptotische Darstellung der Wahrscheinlichkeit P,„(m) durch die 
2! 


Funktion BE desto schlechter wird, je mehr die Wahrscheinlichkeit p 


2n 
von + abweicht, d. h. desto kleinere Werte von p oder q man zu betrachten hat, 


und fürp=0,qg=1, sowie firp=1,gq=0, läßt sich diese Darstellung 
nicht mehr benutzen. Ein beträchtlicher Kreis von Aufgaben erfordert jedoch 
die Berechnung der Wahrscheinlichkeiten P,(m) gerade für kleine Werte von 
p.‘) In diesem Falle liefert der Moıvee-LarLaczsche Satz nur dann ein Er- 
gebnis mit einem unwesentlichen Fehler, wenn die Anzahl n der Versuche sehr 
groß ist. Es ergibt sich daher die Aufgabe, asymptotische Formeln aufzu- 
stellen, die speziell für den Fall kleiner p brauchbar sind. Eine solche Formel 
wurde von Poısson gefunden. 

Wir betrachten eine Folge von Beobachtungsserien, welche die folgenden 
Eigenschaften besitzen: 1. In der n-ten Serie werden n unabhängige Versuche 
ausgeführt, wobei in jedem Versuch darauf geachtet wird, ob ein gewisses Er- 
eignis A, eintritt oder nicht, 2. die Wahrscheinlichkeit dafür, daß das Ereignis 
A,„ eintritt, ist in jedem Versuch der n-ten Serie gleich p, und hängt nur von der 
Nummer der Serie ab. u, gebe an, wie oft das Ereignis A, in der n-ten Serie auf- 
getreten ist. 

!) Oder auch für kleine Werte von g. Man sieht jedoch leicht, daß sich die Aufgaben der 


Aufstellung asymptotischer Formeln für P„(m) bei kleinen Werten von p oder g aufeinander 
zurückführen lassen. 
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Satz von Poısson. Streben die p, für n— oo gegen Null, so gilt | 
aM 
P {mn = m} em 0 Ü) 
mita,=np,- 
Beweis. Offenbar ist 


P,(m) = P {m = m} = Cu pr (1 — p"" 


rT) — m)! Gi (1 = 


(2) 


-[! u 


m werde nun festgehalten. Dann können wir zu beliebig vorgegebenem 
e>0ein A = A(e) so groß wählen, daß für a > A 


ist. 
Wir betrachten zunächst die Zahlen n, für die „> A ist. Für diese n gilt 
auf Grund der Ungleichung 1— x <e’(0@<r<I) 
Nn— m 


Mm — 
P,(m) < re n "<z für n>2m 


und 


Daher gilt für diese n 


an en 
P,(m) — = e” 


€ € 
Sat 


Wir betrachten nun die Zahlen n, für die „<A gilt. Da für „<A die 
Beziehung lim (1 = — e7 Bi = 0 gilt, und da bei konstantem m 


n> 0 
(at-3- == 
lim e 2 sd BER | 
N 00 1_ &\ 


ist, so ist auf Grund der Formel (2) für n > n,(e) 


P,(m) — r een 
m) Re 


<e. 
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Wir bemerken, daß der Satz von Poıssox auch in dem Falle gilt, wo die 
Wahrscheinlichkeit des Ereignisses A in jedem Versuch gleich 0 ist. In diesem 
Falle ist a,=0. 

Wir heben einen Spezialfall des soeben bewiesenen Satzes hervor: p, = — 


’ 


wobei a eine nichtnegative Konstante ist. Man sieht leicht, daß unter dieser 
Voraussetzung 


P(m) = lim P,(m) = 


no m: 


am &—-% 
(m=0,1,2,...). 
Gerade dieses Grenzresultat gewann Poısson. 
Man rechnet leicht nach, daß die Größen P(m) der Gleichung 3 P(m) = 1 
genügen. ” 
Wir untersuchen den Verlauf von P(m) als Funktion von m. Dazu betrachten 
wir den Quotienten 


Für m>a gilt daher P(m) < P(m —1), ist aber m<a, so ist P(m) > 
P(m—1), für m=a schließlich ist P(m) = P(m —1). Hieraus schließen 
wir, daß die Größe P(m) mit wachsendem m von 0 bis m, = [a] wächst und 
danach wieder fällt. Ist a eine ganze Zahl, so besitzt P(m) zwei maximale Werte: 
für m, = a und für m, =a—1. Wir bringen nun einige Beispiele. 

Beispiel 1. Die Wahrscheinlichkeit, ins Ziel zu treffen, sei bei jedem Schuß 
gleich 0,001. Gesucht ist die Wahrscheinlichkeit, mit zwei oder mehr Kugeln 
ins Ziel zu treffen, wenn die Anzahl der Schüsse n = 5000 ist.) 

Jeder Schuß werde als ein Versuch aufgefaßt und das Ins-Ziel-Treffen als 
ein Ereignis. Zur Berechnung der Wahrscheinlichkeit P {z, > 2} können wir 
dann den Poıssoxschen Satz benutzen. In unserem Beispiel ist 


a„= np = 0,001 - 5000 =5. 
Die gesuchte Wahrscheinlichkeit ergibt sich zu 


P{m>2} = P,(m) = 1— P,(0) — P,(1). 
m=2 


Nach dem Poıssonschen Satz ist 
P.0)we5, P,A)»5e5; 


1) Im Großen Vaterländischen Krieg waren die Bedingungen unserer Aufgabe in der 
Praxis gegeben, nämlich beim Beschuß eines Flugzeuges aus Infanteriegewehren. Ein 
Flugzeug wird nur dann durch eine Kugel abgeschossen, wenn diese gerade auf die verwund- 
baren Stellen des Flugzeuges — den Motor, den Flieger, den Benzintank u.a. — trifft. 
Die Wahrscheinlichkeit dafür, daß eine Kugel auf die verwundbaren Stellen bei einem ein- 
zigen Schuß fällt, ist sehr klein, in der Regel feuert jedoch eine ganze Abteilung auf das Flug- 
zeug, und die Gesamtzahl der auf das Flugzeug abgegebenen Schüsse ist ganz bedeutend. 
Dadurch erreicht die Wahrscheinlichkeit dafür, daß eine oder zwei Kugeln treffen, eine 
beachtliche Größe. Dies wurde auch praktisch beobachtet. 
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daher ist 
Pi 22} m1—6e5 » 0,95% . 


Der Maximalwert der Wahrscheinlichkeit P,(m) wird fürm=4undm=5 
angenommen. Diese Wahrscheinlichkeiten sind bis auf vier Stellen hinter dem 
Komma gleich 

P(4) = P(5) » 0,1751. 


Die Berechnung nach einer genauen Formel ergibt bis auf vier Stellen hinter 
dem Komma P;o00(0) = 0,0067 , Psooo(1) = 0,0336. Woraus sich 

P{u = 2} = 0,9597 
ergibt. 

Der bei Benutzung der asymptotischen Formel begangene Fehler ist äußerst 
gering. 

Beispiel 2. In einer Spinnerei bedient eine Arbeiterin einige 100 Spindeln, 
von denen jede einzeln eine Docke Garn spinnt. Bei der Drehung der Spindel 
reißt in gewissen, vom Zufall abhängigen Zeitintervallen auf Grund der Schwan- 
kungen der Fadenspannung und der Ungleichmäßigkeit der Qualität und aus 
anderen Ursachen der Faden. Für die Produktion ist es nun wichtig zu wissen, 
wie oft unter verschiedenen Arbeitsbedingungen (Sorte des Garns, Geschwin- 
digkeit der Spindel usw.) der Faden reißen kann. 

Angenommen, eine Arbeiterin bedient 800 Spindeln und die Wahrscheinlich- 
keit für das Reißen des Fadens auf jeder Spindel im Verlauf eines gewissen 
Zeitintervalls r sei gleich 0,005. Gesucht ist die wahrscheinlichste Anzahl der 
Fadenrisse während der Zeit 7 und die Wahrscheinlichkeit dafür, daß in dieser 
Zeit der Faden nicht öfter als 10 mal reißt. 

In unserem Beispiel ist 


a,=np= 800 0,005 =4, 


daher ist P(3) = P(4). Der Maximalwert der Wahrscheinlichkeit P,(m) für 
das m-malige Abreißen des Fadens in der Zeit 7 wird daherbeim = 3undm =4 
erreicht. 

Nach der Poıssoxschen Formel haben wir 


Pun(3) m z et = 0,1954  Pyo(4) =£ ei = 0,1954. 
Genaue Rechnungen ergeben( bis auf vier Stellen hinter dem Komma) 
P;o0(3) = 0,1956 , 
P;o(4) = 0,1959 . 


Die Wahrscheinlichkeit dafür, daß die Anzahl der Fadenrisse in der Zeit r 
nicht größer als 10 ist, ist gleich 


10 >) 
P{m< 10} = Panlm) = 1— Z, Pomlm) 
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Auf Grund des Poıssonschen Satzes haben wir 


Palm) re (m=0,1,2,...), 
daher ist 
a En BE 
= =1— eh, 
ie mem! 
Nun ist aber 
2, qm , u Do ge gu 4.14 , 
P2-T: > (te tn) Ten‘ = 00076, 


andererseits ist 


er LP EL DE el4s+) +] 


m! 11! 12! 131 14 ' \14 
au. 5, 
— = 0,00284 , 
11135 2 


es ist also 
0,99716 <P {Han < 10} < 0,99724 . 


Ebenso wie bei der Benutzung des Satzes von MoIvRE-LAPLAoE erhebt sich 
die Frage nach einer Abschätzung des Fehlers, den man begeht, wenn man 
die genaue Formel zur Berechnung von P,(m) durch die asymptotische Poıs- 
sonsche Formel ersetzt. 

Aus der Gleichung 


= exp -n 2 +@)}- em(i—R,) 
ee 


finden wir diese Abschätzung leicht für den Fall m=0. Da nämlich bei 
beliebigem positiven x 


mit 


I<1i- e*<z 
ist, so gilt für beliebige a, und n 


1 1 /a„\k 
0< Run DR) 


Nun ist aber 
er a? 1 (=) 
ta Su 
PX n 2m 3 \n 
_.a4 A ai 0 In—ay ai 
2n? sw (1-%) 6n? n—a, "2n(n—a,)” 
n 
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so daß wir schließlich die Ungleichung 
< 
0<R,<.—& 


2(n —a,) 
erhalten. Da AR, nichtnegativ ist, schließen wir, daß wir beim Ersetzen von 
P,„(0) durch e”“r die Wahrscheinlichkeit P,(0) nur wenig vergrößern. 
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Um zu zeigen, wie man die bisherigen Resultate für Zwecke der Natur- 
wissenschaften anwendet, betrachten wir schematisiert das Problem der zu- 
fälligen Irrfahrten eines Teilchens auf einer geraden Linie. Diese Aufgabe 
kann als Prototyp realer physikalischer Aufgaben der Theorie der Diffusion, 
der BrRowsschen Bewegung u. a. betrachtet werden. 

Stellen wir uns vor, daß ein Teilchen, das sich zunächst an der Stelle x = 0 
befindet, in bestimmten Augenblicken zufällige Stöße erfährt, durch die es 
eine Verschiebung nach rechts oder nach links um eine Maßeinheit erleidet. 
In jedem dieser Augenblicke verschiebt es sich also mit der Wahrscheinlich- 


keit - um eine Einheit nach rechts oder mit der gleichen Wahrscheinlichkeit 


um eine Einheit nach links. Nach n Stößen möge das Teilchen sich um den 
Abstand „ verschoben haben. Es ist klar, daß wir es in dieser Aufgabe mit 
dem BERNoULLIschen Schema in seiner reinsten Form zu tun haben. Daraus 
folgt, daß wir für alle n und m die Wahrscheinlichkeit dafür berechnen können, 
daß « = m ist. Es ist nämlich 


2 
Pf{a=m}=1n 
0 für |m|l>n. 


Für große Werte von n ist — wie leicht aus dem lokalen Grenzwertsatz von 
Morvre-LaArLace folgt — 


_mn BR -5 
P{u= m} en (1) 
Die gewonnene Formel können wir folgendermaßen interpretieren. Zu Anfang 
sei eine große Anzahl von Teilchen vorhanden, die die Koordinate = 0 
besitzen. Alle diese Teilchen beginnen sich unabhängig voneinander auf der 
Geraden unter der Einwirkung zufälliger Stöße zu verschieben. Nach n Stößen 
ist der Anteil der Teilchen, die sich um den Abstand m verschoben haben, 
durch die Formel (1) gegeben. ’ 

Es versteht sich, daß wir es hier nur mit idealisierten Bedingungen für die 
Bewegung von Teilchen zu tun haben und daß sich die wirklichen Moleküle 
unter sehr viel komplizierten Bedingungen bewegen. Jedoch liefert das ge- 
wonnene Resultat ein richtiges qualitatives Bild der Erscheinung. 
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In der Physik betrachtet man noch kompliziertere Beispiele zufälliger 
Bewegungen. Wir beschränken uns auf eine rein schematische Betrachtung des 
Einflusses 1. einer spiegelnden Wand, 2. einer absorbierenden Wand. 

Stellen wir uns vor, daß sich im Abstand s rechts vom Punkt x = eine 
spiegelnde Wand befindet; fällt also ein Teilchen in irgendeinem Augenblick 
auf diese Wand, so schlägt es bei dem folgenden Stoß mit der Wahrscheinlich- 
keit Eins die Richtung ein, aus der es gekommen war. 

Der Anschaulichkeit halber stellen wir die Lage eines Teilchens in der Ebene 
(x,i) dar. Der Weg eines Teilchens bildet dann einen Streckenzug in dieser 
Ebene. Bei jedem Stoß bewegt sich das Teilchen um eins nach „oben“ und 
um eine Einheit nach rechts oder nach links (jedesmal wenn x < s ist, mit der 


Wahrscheinlichkeit 2). Ist aber e=s, so bewegt sich das Teilchen bei dem 


nächsten Stoß um eine Einheit nach links. 

Zur Berechnung der Wahrscheinlichkeit P{s = m} gehen wir folgender- 
maßen vor: Wir denken uns die Wand zunächst entfernt und gestatten dem 
Teilchen, sich frei zu bewegen, als wäre keine Wand vorhanden. In der Ab- 
bildung 12 sind solche idealisierten Wege eingezeichnet, die zu den Punkten A 


® 
= 
ak 
4 
7a 
Anl 
IS 
BEN 


Das ll. 
NE 


und A’ führen, die symmetrisch zur spiegelnden Wand liegen. Ein reales 
Teilchen, das sich unter dem Einfluß der spiegelnden Wand bewegt, erreicht 
dann und nur dann den Punkt A, wenn es unter den idealisierten Bedingungen 
(ohne spiegelnde Wand) entweder den Punkt A oder den Punkt A’ erreicht. 
Die Wahrscheinlichkeit dafür, daß das Teilchen im idealisierten Falle den 
Punkt A erreicht, ist offenbar gleich 


P{a=m} geoon 


8 Gnedenko 
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Ebenso ist die Wahrscheinlichkeit dafür, daß das Teilchen den Punkt A’ 

erreicht, gleich 
P{u=2s—m}= 


n! ( 1 Y 
n—m\, nm =. 
(e+ N -)! 
(die Abszisse des Punktes A’ ist gleich 2s — m). 
Folglich ist die gesuchte Wahrscheinlichkeit gleich 
P.(m, s) = fu=m}+P{ua=2s—m}. 


Unter Benutzung des lokalen Grenzwertsatzes von MoıvRE-LAPLAce finden 
wir 


2 m _(2:— m) 
P,(m, s) m le an le 2n I. 


Dies ist eine bekannte Formel aus der Theorie der Brownschen Bewegung. 
Sie erhält eine symmetrische Gestalt, wenn man den Koordinatenursprung in 
den Punkt x = s verlegt, also mit Hilfe der Substitution z= 2 — s zu einer 
neuen Koordinate z übergeht. Dann erhalten wir die Formel 
[ _k+9' _k—s) 

2n +e 2n 


Pt=h=Plk+ss} at 
Wir kommen nun zur Betrachtung der dritten schematisierten Aufgabe, in 
der sich auf dem Wege des Teilchens im Punkt x = s eine absorbierende Wand. 
befindet. Ein Teilchen, das auf diese Wand fällt, nimmt an der weiteren 
Bewegung nicht mehr teil. Offenbar ist 

in diesem Beispiel die Wahrscheinlichkeit 

dafür, daß ein Teilchen sich nach n Stößen 

im Punktex = m(m < s) befindet, kleiner 

als P„(m) (d. h. kleiner als dieWahrschein- 

lichkeit dafür, daß das Teilchen auf diesen 

‚Punkt ohne absorbierende Wand fällt). 

/ Wir bezeichnen die gesuchte Wahrschein- 

x / lichkeit mit P,(m, s).. 

\ ge Zur Berechnung von P,(m, s) denken 
\ / wir uns wieder die absorbierende Wand 
N / : fort und lassen das Teilchen auf einer 

N I Geraden sich frei bewegen. Ein Teilchen, 

das zu irgendeinemZeitpunkt an die Stelle 

x = s gelangt, befindet sich in dem folgen- 

den Augenblick mit ein und derselben 

Wahrscheinlichkeit rechts und links von 

5 der Geraden 2=s. Es kann also das 

Abb. 13 Teilchen, nachdem es sich auf der Gera- 
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den £=s befunden hat, mit ein und derselben Wahrscheinlichkeit entweder 
auf den Punkt A(m, n) oder auf den Punkt A’(2s — m, n) fallen. Zum Punkte 
A’ kann das Teilchen aber nur dann gelangen, wenn es vorher einmal die Stellung 
x = sinnehatte. Daher gibt es zu jedem zum Punkte A’ führenden Weg einen 
bezüglich der Geraden x = s symmetrisch gelegenen Weg, der zum Punkte A 
führt. Ebenso gibt es zu jedem in der tatsächlichen Bewegung verbotenen Weg 
zum Punkt A einen bezüglich der Geraden x = s symmetrischen Weg, der zum 
Punkt A’ führt. Dabei bemerken wir, daß wir die Symmetrie der Wege erst 
von dem Augenblick in Betracht ziehen, wo sich ein Teilchen auf der Geraden 
z = s befunden hat. Wir müssen daher bei der Lösung unserer Aufgabe von 
den in der idealisierten Bewegung zum Punkt A führenden Wegen alle die 
Wege weglassen, die zum Punkt A’ führen. Folglich ist 


P,(m, s) = P{u=m}— P{u=2s—m}, 
und auf Grund des lokalen Grenzwertsatzes von MoIVRE-LAPLACE haben wir 
schließlich m (28 — m)! 


P,(m, s) m e zr_e 2» 


2ıan 


Übungen 


1. Ein Arbeiter bedient 12 gleiche Maschinen. Die Wahrscheinlichkeit dafür, daß eine 
Maschine die Aufmerksamkeit des Arbeiters im Verlauf eines Zeitintervalls der 


Länge r erfordert, sei gleich 3- Wie groß ist die Wahrscheinlichkeit dafür, daß 


a) 4 Maschinen in der Zeit 7 zugleich die Aufmerksamkeit des Arbeiters erfordern; 
b) die Anzahl der Maschinen, die in der Zeit r die Aufmerksamkeit des Arbeiters 
erfordern, zwischen 3 und 6 einschließlich liegt ? 


2. In einer Familie sind 10 Kinder. Unter der Annahme, daß die Wahrscheinlichkeit 
der Geburt eines Knaben und der eines Mädchens je gleich en ist, bestimme man die 
Wahrscheinlichkeit dafür, daß in der Familie 2 
a) 5 Knaben und 5 Mädchen sind; 

b) die Anzahl der Knaben zwischen 3 und 8 liegt. 


3. Es sitzen 4 Menschen beieinander. Die Geburtstage von 3 von ihnen liegen alle in 
einem Monat, der Geburtstag des vierten liege in einem der übrigen 11 Monate. Es 
werde angenommen, daß die Wahrscheinlichkeit der Geburt im Verlauf jedes Monats 


für jede Person gleich n ist. Nun bestimme man die Wahrscheinlichkeit dafür, daß 


a) die genannten 3 Personen im Januar und die vierte Person im Oktober geboren 
wurden; 

b) 3 Personen in irgendeinem Monat geboren sind und die vierte in einem der 
übrigen 11 geboren ist. 


4. Es werde 14400mal eine Münze geworfen; dabei zeige sich 7428mal der Kopf der 
Münze. Wie groß ist die Wahrscheinlichkeit dafür, daß die Anzahl des Auftretens 
des Kopfes so stark oder noch stärker vonn pabweicht, wenn die Münze symmetrisch 
ist (d.h. die Wahrscheinlichkeit des Auftretens des Kopfes sei bei jedem Versuch 


1 
leich —) ? 
gleic 3) 


8* 
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10. 


11. 


5. An ein Elektrizitätsnetz sind n Geräte angeschlossen, jedes mit der Leistung a kW. 
In jedem Zeitpunkt wird von jedem Gerät mit der Wahrscheinlichkeit p Energie ver- 
braucht. Gesucht ist die Wahrscheinlichkeit dafür, daß die zu einem gegebenen Zeit- 
punkt ausgenutzte Leistung 
a) kleiner ist als nap; 

b) größer ist als rnap (0 < r < 1) unter der Bedingung, da np groß ist. 


6. An einer Hochschule studieren 730 Studenten. Die Wahrscheinlichkeit dafür, daß der 


Geburtstag eines willkürlich herausgegriffenen Studenten auf einen bestimmten Tag 
des Jahres fällt, sei gleich 205 für jeden der 365 Tage. Man bestimme 


a) die wahrscheinlichste Anzahl von Studenten, die am 1. Januar geboren sind; 


b) die Wahrscheinlichkeit dafür, daß 3 Studenten ein und denselben Geburtstag 
haben. 


. Es sei bekannt, daß die Wahrscheinlichkeit der Produktion von fehlerhaften Bohrern 


gleich 0,02 ist. Die Bohrer werden in Schachteln zu je 100 Stück verpackt. Wie 

groß ist die Wahrscheinlichkeit dafür, daß 

a) in einer Schachtel keine fehlerhaften Bohrer sind; 

b) die Anzahl der fehlerhaften Bohrer in einer Schachtel nicht größer als 3 ist ? 

c) Wieviele Bohrer muß man in eine Schachtel packen, daß mit einer Wahrscheinlich- 
keit nicht kleiner als 0,9 in ihr wenigstens 100 einwandfreie sind ? 

(Hinweis: Man benutze die Poıssossche Verteilung.) 


. In einer Versicherungsgesellschaft seien 10000 Personen gleichen Alters und gleicher 


sozialer Stellung versichert. Die Sterbewahrscheinlichkeit im Verlaufe eines Jahres 

sei für jede Person gleich 0,006. Jeder Versicherte bezahlt am 1. Januar DM 12,— 

Versicherungsbeitrag und seine Verwandten erhalten im Sterbefalle von der Gesell- 

schaft DM 10000,—. Wie groß ist die Wahrscheinlichkeit dafür, daß die Gesellschaft 

a) mit Verlust arbeitet; 

b) einen Gewinn von nicht weniger als DM 40000,—, DM 60000,—, DM 80000,— 
erzielt ? 


. Man beweise: Sind P und P’ die Wahrscheinlichkeiten der wahrscheinlichsten Anzahl 


des Eintretens eines Ereignisses A in n bzw. n + 1 unabhängigen Versuchen [in jedem 
Versuch sei P(A) = p], so ist P'<P. Das Gleichheitszeichen ist ausgeschlossen, 
wenn (n + 1) p keine ganze Zahl ist. 


Im BernouLtischen Schema sei 9 = 5 Man beweise: 
&) I < Panln) < = 
< Pen{n) Ss ————; 
2 Yn ® Y2 n-+l1 
b) Im Paulnth) _ u ‚ wenn lim Iug (<z<m. 
no Pan(n) n>oyn 
Man beweise, daß fürn pq >25 
pn 
1 _—- —p) (f? — 
Pain) = —ı [ee], 
je: y2anpgq Yapaq 
—_ WERE URS 
FREE. np (a PIE DBE Ip q Ije z/rra 


(n p q)®!2 


12. 


13. 


14. 


16. 
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Es werden n unabhängige Versuche ausgeführt. Die Wahrscheinlichkeit dafür, daß 
das Ereignis A im i-ten Versuch eintritt, sei gleich p;; P,„(m) sei die Wahrscheinlich- 
keit dafür, daß in rn Versuchen das Ereignis A m mal eintritt. Man beweise, daß 


Pal) _ Pn(2) SER P,„(n) 


Mi PO) Pi)“  —Pin—n 


b) P„(m) zunächst wächst und später abnimmt. [Wenn P,(0) oder P,„(n) selbst noch 
nicht maximal sind.] 


oo zi 
Man beweise, daß für x > 0 die Funktion f e ®dzden Ungleichungen 
x 
1 © 1 1 
x _-—2 _—z 1 
e 2 e 2 en F} 
1+. = | d< = . 


z 


genügt. 


Aufgabe von S. BanacH. Ein Mathematiker hat 2 Schachteln Streichhölzer bei sich. 
Jedesmal, wenn er sich ein Streichholz anzünden will, nimmt er auf gut Glück eine 
der Schachteln. Man bestimme die Wahrscheinlichkeit dafür, daß, wenn der Mathe- 
matiker eine leere Schachtel herausnimmt, in der anderen Schachtel noch r Streich- 
hölzer sind (r = 0,1,2,...,»;n ist die Anzahl der Streichhölzer, die anfangs in 
jeder Schachtel waren). 


. An eine elektrische Leitung seien n Geräte angeschlossen. Die Wahrscheinlichkeit 


dafür, daß ein Gerät, das im Zeitpunkt t Energie abnimmt, bis zum Zeitpunkt ti + 4t 
die Energieentnahme einstellt, sei gleich & dt + o(4t). Wenn im Zeitpunkt t ein 
Gerät keine Energie verbraucht, so sei die Wahrscheinlichkeit dafür, daß es bis zum 
Zeitpunkt ? + At eingeschaltet wird, gleich ß At -+ o(At). P,(t) sei die Wahrschein- 
lichkeit dafür, daß im Zeitpunkt i gerade r Geräte Energie verbrauchen. Man stelle 
Diiferentialgleichungen auf, denen die P,(t) genügen müssen. 

Bemerkung: Man kann leicht konkrete Beispiele angeben, in denen die Bedingungen 
dieser Aufgabe realisiert sind: im Straßenbahnverkehr, Werkbänke in einer Fabrik 
mit automatischer Abschaltung u. a. 


Ein Arbeiter bedient n gleiche automatische Werkbänke. Wenn im Zeitpunkt t eine 
Werkbank arbeitet, so sei die Wahrscheinlichkeit dafür, daß sie bis zum Zeitpunkt 
t + At die Aufmerksamkeit des Arbeiters erfordert, gleich @ At -+ o(4t). Wenn im 
Zeitpunkt t der Arbeiter an irgendeiner Werkbank beschäftigt ist, so sei die Wahr- 
scheinlichkeit dafür, daß er bis zum Zeitpunkt t + At seine Arbeit an dieser Maschine 
beendet hat, gleich 8 At + o(At). P,(t) seien die Wahrscheinlichkeiten dafür, daß im 
Zeitpunkt t gerade n— r Werkbänke arbeiten, daß der Arbeiter an einer Werkbank 
beschäftigt ist und r — 1 stillstehen und darauf warten, von dem Arbeiter bedient zu 
werden [P,(t) sei die Wahrscheinlichkeit dafür, daß alle Werkbänke arbeiten]. Man 
stelle Differentialgleichungen für die Wahrscheinlichkeiten P,(t) auf. 

Bemerkung: Ganz analog kann man leicht Differentialgleichungen für die etwas 
kompliziertere Aufgabe aufstellen, wo N Werkbänke von einer Brigade von k Arbeitern 
bedient werden. Für praktische Zwecke ist der Vergleich der Wirtschaftlichkeit der 
beiden Systeme der Arbeitsorganisation recht wichtig. Zu diesem Zweck muß man 
die Wahrscheinlichkeiten P,(t) für — oo betrachten, d.h. die Arbeitsorganisation 
nach längerer Arbeit. Es zeigt sich, daß die Arbeit einer Brigade, die k-n Werkbänke 
bedient, erfolgleicher ist als die Bedienung von n Werkbänken durch einen Arbeiter, 
und zwar sowohl im Sinne einer bestmöglichen Ausnutzung der Arbeitszeit der Werk- 
bänke als auch der Arbeitszeit des Arbeiters. 


a Ze m Den nn 


III. 
MARKOWSCHE KETTEN 


$ 17. Definition einer Markowschen Kette. Die Übergangsmatrix 


Die direkte Verallgemeinerung des Schemas der unabhängigen Versuche ist 
das Schema der sog. Markowschen Ketten, die zuerst von dem bekannten 
russischen Mathematiker A. A. MARKow systematisch untersucht wurden. Wir 
beschränken uns hier auf eine Darstellung der Elemente dieser Theorie. 

Stellen wir uns vor, daß eine Folge von Versuchen ausgeführt wird, wobei in 
jedem Versuch nur genau eins der k unvereinbaren Ereignisse AP, AY,..., Aß) 
eintreten kann (der obere Index bezeichnet wie im vorigen Kapitel die Nummer 
des Versuchs). Wir sagen, eine Folge von Versuchen bilde eine Markowsche 
Kelte, genauer eine einfache Markowsche Kette, wenn die Wahrscheinlichkeit 
für das Eintreten des Ereignisses AD i—=1,2,...,k) im (s + 1)-ten Versuch 
(s=1,2,3,...) nur davon abhängt, welches Ereignis im s-ten Versuch eintrat, 
und sich nicht ändert, wenn man zusätzlich weiß, welche Ereignisse in früheren 
Versuchen eingetrelen waren. 

Häufig gebraucht man zur Darstellung der Theorie der Markowschen Ketten 
eine andere Terminologie. Man spricht dann von einem physikalischen System S, 
das sich in jedem Zeitpunkt in einem der Zustände A, A,..., A; befinden 
kann und seinen Zustand nur in den vorgegebenen Zeitpunkten f,t,..., 
in... ändert. Für eine Markowsche Kette hängt die Wahrscheinlichkeit 
dafür, daß sich das System im Zeitpunkt r(, <r<t,,,) in irgendeinem Zu- 
stand A,i=1,2,...,k) befindet, nur davon ab, in welchem Zustand sich 
das System im Zeitpunkt ?(f,_, <i< 4) befunden hat, und sie ändert sich 
nicht, wenn man die Zustände in noch früheren Zeitpunkten kennt. 


Zur Illustration betrachten wir zwei schematische Beispiele. 


Beispiel. Stellen wir uns vor, daß sich ein auf einer Geraden befindliches 
Teilchen längs dieser Geraden unter dem Einfluß zufälliger Stöße bewegt, die 
zu den Zeitpunkten 2, tg, f,,.... erfolgen. Das Teilchen kann sich in den Punkten 
mit den ganzzahligen Koordinaten ,a+1,a+2,...,b befinden; in den 
Punkten a und 5 seien spiegelnde Wände angebracht. Jeder Stoß verschiebt 
das Teilchen nach rechts mit der Wahrscheinlichkeit p und nach links mit der 
Wahrscheinlichkeit g = 1— p, wenn sich das Teilchen nicht gerade an einer 
Wand befindet. Liegt das Teilchen aber an einer der beiden Wände, so führt 
es jeder Stoß um eine Maßeinheit in das Innere des Raumes zwischen den 
Wänden zurück. Wir sehen, das angeführte Beispiel der Irrfahrt eines Teilchens 


817. Definition einer Markowschen Kette. Die Übergangsmatrix 105 


stellt eine typische Markowsche Kette dar. Genauso könnte man den Fall 
betrachten, wo das Teilchen von einer Wand oder von beiden Wänden absor- 
biert wird. 


Beispiel 2. Im Bousschen Modell eines Wasserstoffatoms kann sich das 
Elektron auf einer der zugelassenen Kugelschalen befinden. Wir bezeichnen mit 
A, das Ereignis, daß sich das Elektron auf der i-ten Kugelschale befindet. 
Wir setzen ferner voraus, daß eine Zustandsänderung des Atoms nur in den 
Zeitpunkten t,, t,, t,,... erfolgen kann (in Wirklichkeit sind diese Augenblicke 
selbst Zufallsgrößen). Die Wahrscheinlichkeit für den Übergang von der i-ten 
Kugelschale auf die j-te zum Zeitpunkt i, hängt nur von i und j ab (die Dif- 
ferenz j—i hängt von dem Energiequantum ab, um das sich die Ladung des 
Atoms im Zeitpunkt i, geändert hat), und nicht davon, auf welchen Kugel- 
schalen sich das Elektron früher befunden hat. 

Das letzte Beispiel stellt eine Markowsche Kette mit einer (natürlich nur 
im Prinzip möglichen) unendlichen Anzahl von Zuständen dar; dieses Beispiel 
würde dem realen Sachverhalt sehr viel näher kommen, wenn sich die Zeit- 
punkte des Übergangs unseres Systems in einen neuen Zustand stetig ändern 
könnten. 

Wir beschränken uns im folgenden auf die Darstellung der einfachsten 
Tatbestände für homogene Markowsche Ketten. Für diese hängt die bedingte 
Wahrscheinlichkeit für das Auftreten des Ereignisses AY'*" im (s + 1)-ten Ver- 
such unter der Bedingung, daß im s-ten Versuch das Ereignis A(" eingetreten 
war, nicht von der Nummer des Versuchs ab. Diese Wahrscheinlichkeit nennen 
wir Übergangswahrscheinlichkeit und bezeichnen sie mit dem Buchstaben p;;; 
in dieser Schreibweise bezeichnet der erste Index stets das Resultat des vorher- 
gehenden Versuchs, der zweite Index gibt an, in welchen Zustand das System 
im nachfolgenden Zeitpunkt übergeht. 

Ein vollständiges wahrscheinlichkeitstheoretisches Bild der möglichen 
Änderungen, die beim Übergang von einem Versuch zu dem unmittelbar folgen- 
den eintreten können, vermittelt die aus den Übergangswahrscheinlichkeiten 
gebildete Matrix 


Pu Pıa---Pır 
„= Pa Pax. Pa 
Prı Pr2 - - - Pr 


Wir nennen sie die Übergangsmatrix. Welchen Bedingungen müssen die Ele- 
mente dieser Matrix genügen? Vor allem müssen sie als Wahrscheinlichkeiten 
nichtnegative Zahlen sein, d. h., für alle i und j muß 


0<p;<sI1 


sein. Ferner ergibt sich aus der Forderung, daß beim Übergang aus einem 
Zustand A im s-ten Versuch das System unbedingt in genau einen Zustand 
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ayrN im (s + 1)-ten Versuch übergehen soll, die Gleichung 


k 
Ep;=1 (=1,2...,0. 
j=-1 


Die Summe der Elemente jeder Zeile der Übergangsmatrix ist also gleich Eins. 
Zur Veranschaulichung betrachten wir noch einige weitere Beispiele. 


Beispiel 3. Unser System S möge die drei Zustände A,, A,, A; annehmen 
können; der Übergang aus dem einen Zustand in den anderen vollziehe sich 
nach dem Schema der homogenen Markowschen Kette; die Übergangswahr- 
scheinlichkeiten seien durch die Matrix 

1/2, 1/6, 1/3‘ 
m=I1j2, 0, ") 
gegeben. 1/3, 1/3, 1/3 

Wie wir sehen, kann das System, wenn es sich im Zustand A, befindet, beim 
nächsten Schritt mit der Wahrscheinlichkeit 1/, im selben Zustand verbleiben, 
mit der Wahrscheinlichkeit t/, in den Zustand A, und mit der Wahrscheinlich- 
keit !/;, in den Zustand A, übergehen. Wenn sich das System im Zustand A, 
befindet, so kann es sich nach dem Übergang mit gleicher Wahrscheinlichkeit 
nur in dem Zustand A, oder A, befinden, das Verbleiben im Zustand A, ist 
unmöglich. Die letzte Zeile der Matrix zeigt, daß das System aus dem Zustand A, 
in jeden anderen mit der gleichen Wahrscheinlichkeit 1/, übergehen kann. 


Beispiel 4. Wir schreiben die Übergangsmatrix für ein Teilchen auf, das 
sich zwischen zwei spiegelnden Wänden bewegt (vgl. Beispiel 1). Der Aufent- 
hali des Teilchens im Punkt mit der Koordinate a sei das Ereignis A,, der Auf- 
enthalt im Punkt @ + 1 das Ereignis A,, ..., der Aufenthalt im Punkt 5b das 
Ereignis A,(s =b— a + 1) ; dann lautet die Übergangsmatrix 


0, 1, 0,...,0, 0 


Pe Dur Bar Ba ee a 


Beispiel 5. Wir schreiben auch die Übergangsmatrix für ein Teilchen auf, 
das sich zwischen zwei absorbierenden Wänden bewegt. Die Bezeichnung der 
Ereignisse und die übrigen Bedingungen sind dieselben wie im vorangegangenen 
Beispiel. Der Unterschied besteht nur darin, daß das Teilchen, wenn es in die 
Zustände A, und A, gerät, mit der Wahrscheinlichkeit 1 dort verbleibt: 


Kr ee 
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Unsere erste Aufgabe in der Theorie der Markowschen Ketten besteht in 
der Bestimmung der Wahrscheinlichkeit für den Übergang aus dem Zustand A{" 
im s-ten Versuch in den Zustand Ay+n nach n Versuchen. Wir bezeichnen 
diese Wahrscheinlichkeit durch P;;(n).. 

Wir betrachten irgendeinen dazwischen liegenden Versuch mit der Nummer 
s-+ m. In diesem Versuch kann irgendeines der möglichen Ereignisse A!+"” 
(1<r<k) eintreten. Die Wahrscheinlichkeit eines solchen Übergangs ist mit 
den oben eingeführten Bezeichnungen gleich P;,(m). Die Wahrscheinlichkeit 
für den Übergang aus dem Zustand AP**”) in den Zustand A$+” ist aber gleich 
P,;(n — m). Nach der Formel der totalen Wahrscheinlichkeit ist dann 


k 
P;;(n) = 2 Pıudm) Pr; (n—m). (1) 


Wir bezeichnen mit x, die Übergangsmatrix nach n Versuchen 


\; un) Poln) ... Pin) 
1 


Pain) Pysln).. . Prn)) 


Nach (1) besteht zwischen den Matritzen n, mit verschiedenen Indizes die 
Beziehung 
In = Um * An—m ((<m<n). 
Insbesondere finden wir fürn = 2 
Ben mn; 
fürn =3 
Bm men mn; 
und allgemein bei beliebigem n 
m=m. 


Wir vermerken noch einen Spezialfall der Formel (1): Für m = 1 ist 
k 
Pin) = Pr P,;(n —]). 
r=1 


Beispiel 6. Eine einfache Rechnung zeigt, daß in den Beispielen 4 und 5 
dieses Paragraphen die Übergangsmatrizen für zwei Schritte folgende Form 
haben: 


Bei spiegelnden Wänden (s >5) 


4 8, pp 09 0...,0090 
0, a+p,0 pP © 0,0, 0 
q>, 0, 2 Pg, 0, p°®, ’ 0, 0, 0 


. hr 
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bei absorbierenden Wänden 


oO 


9 pg 0, Dir04 


De Te er 


0,::0,..0, RER | 


Es ist intuitiv klar, daß das Teilchen zwischen den spiegelnden Wänden in 
einer großen Zahl von Schritten die Möglichkeit hat, sich in jedem Punkt 
zwischen den Wänden aufzuhalten. Bei absorbierenden Wänden ist, je mehr 
Schritte das System vollzieht, die Wahrscheinlichkeit für die Absorption um so 
größer. 


$ 18. Klassifizierung der möglichen Zustände 


Wir erläutern hier eine Klassifizierung der Zustände, die fast gleichzeitig 
vonA.N.KoLMoGoRoFF für Markowsche Ketten mit einer abzählbaren Zustands- 
menge und von W. DorBLın für Markowsche Ketten mit einer endlichen 
Zustandsmenge erklärt worden sind. 

Ein Zustand A, heißt unwesentlich, wenn ein Zustand A, und ein n existieren, 
so daß P;,;{n) > 0, aber P;,(m) = 0 für alle m. Die unwesentlichen Zustände 
haben also die Eigenschaft, daß das System aus ihnen mit positiver Wahrschein- 
lichkeit in einen gewissen anderen Zustand gelangen kann, daß es aber aus 
diesem anderen Zustand nicht in den unwesentlichen (Anfangs-) Zustand zurück- 
kehren kann. Von den Beispielen des vorhergehenden Paragraphen betrachten 
wir das fünfte, das sich zwischen absorbierenden Wänden bewegende Teilchen. 
Wie man leicht sieht, sind hier alle Zustände mit Ausnahme von A, und A, 
unwesentlich. In der Tat kann das Teilchen, wenn es sich in einem von A, und 
A, verschiedenen Zustand befindet, mit positiver Wahrscheinlichkeit in einer 
endlichen Anzahl von Schritten nach A, und nach A, gelangen, aber aus diesen 
Zuständen kann es in keinen anderen übergehen. 

Alle nicht unwesentlichen Zustände heißen wesentlich. Aus der Definition 
folgt, daß, wenn die Zustände A, und A, wesentlich sind, solche natürliche 
Zahlen m und n existieren, daß zusammen mit der Ungleichung P;,(m) > 0 
auch die Ungleichung P,,;(n) > 0 erfüllt ist. Wenn für die Zustände A; und A, 
mit gewissen Zahlen m und n diese beiden Ungleichungen gelten, so nennt 
man sie kommunizierend. Wenn A, und A, einerseits und A, und A, anderer- 
seits kommunizieren, so kommunizieren auch A; und A,. Daher zerfallen alle 
wesentlichen Zustände in Klassen, so daß alle Zustände einer Klasse kommu- 
nizieren, aber Übergänge zwischen verschiedenen Klassen unmöglich sind. In 
den Beispielen 3 und 4 des vorangegangenen Paragraphen sind alle Zustände 
wesentlich und in beiden Fällen gibt es nur eine einzige Klasse von Zuständen. 

Da für einen wesentlichen Zustand A, und einen unwesentlichen A, bei 
beliebigem m die Gleichung P;,(m) = 0 gilt, so können wir folgendes erschlie- 
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Ben: Wenn das System in einen Zustand einer bestimmten Klasse von wesent- 
lichen Zuständen fällt, so kann es diese Klasse nicht mehr verlassen. Im Bei- 
spiel 5 gibt es zwei Klassen von wesentlichen Zuständen, und jede von ihnen 
besteht nur aus einem einzigen Element; die eine Klasse besteht aus dem Zu- 
stand A,, die andere aus dem Zustand A,. 

Wir wollen den Mechanismus des Übergangs aus einem Zustand in einen 
anderen Zustand derselben Klasse genauer betrachten. Dazu fassen wir irgend- 
einen wesentlichen Zustand A, ins Auge und bezeichnen mit M; die Menge aller 
ganzen Zahlen m, für die P;;(m) > 0 ist. Auf Grund der Definition der wesent- 
lichen Zustände kann diese Menge nicht leer sein. Wenn die Zahlen m und n 
zur Menge M, gehören, so liegt, wie man leicht sieht, auch die Summe m + n 
in dieser Menge. Wir bezeichnen mit d,; den größten gemeinsamen Teiler aller 
Zahlen von M;. Natürlich besteht M, nur aus ganzzahligen Vielfachen von d;.') 
Die Zahl d; heißt die Periode des Zustandes A,. 

Es seien A, und A; zwei zur selben Klasse gehörende Zustände. Nach dem 
Vorangegangenen gibt es solcheZahlen m und n, für die P;,(m)>O und P; (n)>0. 
Natürlich gehört die Zahl m-+n zu M,, und folglich ist sie durch d; teilbar. 
Es sei r eine beliebige hinreichend große Zahl, dann gehört rd, zu M,, d.h. 
P;j( d,) > 0. Wegen 


P;,(m n. Td; + n) > P,;(m) » P;j(e d,) P;i{n) >0 


gehören alle Zahlen m + rd; -+ n bei hinreichend großem r zu M,. Da aber 
die Zahl m + n durch d; teilbar ist, muß auch rd; den Faktor d; enthalten. 
Da r willkürlich ist, ist also d; durch d; teilbar. Durch ähnliche Überlegungen 
kann man zeigen, daß d; durch d; teilbar ist; also folgt d; = d;. Alle Zustände 
ein und derselben Klasse haben also dieselbe Periode, die wir im weiteren mit d 
bezeichnen. 

Dieses Resultat gestattet folgenden Schluß: Für zwei Zustände A; und 4,, 
die zur selben Klasse gehören, gelten die Ungleichungen P;,(m) > 0 und P,;;(n) 
> O nur dann, wenn m und -n gleich sind modulo d.?2) Wenn wir einen bestimm- 
ten Zustand A, unserer Klasse herausgreifen, so können wir daher jedem Zu- 
stand A; dieser Klasse eine bestimmte Zahl £(i) (1 s Pi sd) zuordnen, 
so daß die Ungleichung P,;(n) > 0 nur für solche Werte möglich ist, die der 
Kongruenz n= ß(i) (mod d) genügen. Alle Zustände A;, denen dieselbe Zahl 8 
zugeordnet ist, fassen wir zur Unterklasse S; zusammen. Unsere Klasse von 
wesentlichen Zuständen zerfällt somit in d Unterklassen S,. Diese Unterklassen 
haben die Eigenschaft, daß das System aus einem Zustand, der zu S,; gehört, 
beim nächsten Schritt nur in einen Zustand von S;;ı übergehen kann. Wenn 
$ = d, so geht das System in einen Zustand der Unterklasse S, über. 

Es möge A; zur Unterklasse S, und A, zur Unterklasse S, gehören. Nach dem 
bisherigen ist klar, daß die Wahrscheinlichkeit P;;(n) nur dann von 0 verschie- 


1) Es zeigt sich, daß zu M; alle genügend großen Vielfachen von d; gehören. 
2) Mit anderen Worten, wenn die Summe m -+ rn durch d teilbar ist. 
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den sein kann, wenn n= y—ß (mod d). Wenn n dieser Gleichung genügt und 
hinreichend groß ist, so ist die Ungleichung P;,;(n) > 0 tatsächlich erfüllt. 

Zur Veranschaulichung betrachten wir das Beispiel 4 des vorangegangenen 
Paragraphen. Wie wir sahen, bilden die Zustände des Systems eine Klasse. 
Aus einem beliebigen Zustand A; kann das System mit positiver Wahrschein- 
lichkeit nach zwei Schritten (und auch erst nach mindestens zwei Schritten) 
in eben diesen Zustand zurückkehren, d.h. d = 2. 

Daher verteilen sich die Zustände des Systems auf zwei Unterklassen S, und 
S,. Wir zählen zur Unterklasse S, alle Zustände mit ungeradem Index, zur 
Unterklasse S, alle Zustände mit geradem Index. Natürlich kann das System 
aus dem Zustand von S$, in einem Schritt nur in einen Zustand von $, über- 
gehen; entsprechend kann es aus $, in einem Schritt nur in einen Zustand von 
S, übergehen. 


$ 19. Ein Satz über Grenzwahrscheinliehkeiten 


Satz. Sind für irgendein s > 0 alle Elemente der Übergangsmatrix r, positiv, 
so gibt es konstante Zahlen p; (j=1,2,...,k) derart, daß unabhängig vom 
Index i die Gleichungen 
besiehen. TR 

Beweis. Die Beweisidee ist überaus einfach: Man stellt zunächst fest, daß 
die größte der Wahrscheinlichkeiten P;;(n) mit wachsendem rn nicht wachsen 
und die kleinste nicht abnehmen kann. Ferner wird gezeigt, daß das Maximum 
der Differenz P;;(n) — P,;(n) (,1=1,2,...,k) für n— oo gegen Null strebt. 
Damit ist dann der Beweis des Satzes offenbar beendet. Denn auf Grund des 
bekannten Satzes über den Grenzwert einer monotonen beschränkten Folge 
schließen wir aus den ersten beiden Eigenschaften der Wahrscheinlichkeiten 
P;;(n), daß 

lim min P;,(n)=p; 
n> oo 1<i<sk 
und 
lim max P;,(n) = p; 
n> wo 1<i<k 


existieren. Da auf Grund der dritten angegebenen Eigenschaft 


lim max |P;;(n) — P,;(n)| = 0 
k 


n>o 1<il< 
ist, so ist schließlich u 
P=D=P; 
Wir kommen nun zur Ausführung des entworfenen Plans. Wir bemerken 
zunächst, daß für n > 1 die Ungleichung 


k k 
P;;(n) = 2PpıPij (n—1) > min P;; (n—1) 2 pi: = min P;; (n—1) 
I=1 1<I<k i=1 ı1<I<k 
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besteht. Diese Ungleichung gilt für jedes i, insbesondere für das, bei dem 
P;;(n) = min P,,(n) 
1<I<k 
ist. Folglich ist 
min P;;(n) > min P;,(n— 1). 
1<i<k 1<i<k 
Analog zeigt man, daß 
max P;,{n) < max P;,(n — 1) 
1<i<k 1<i<k 
ist. 
Wir können n > s annehmen und dürfen somit nach Formel (1), $ 18, 


k 
P;;(n) m & Pix) r P,(n — 5) 


schreiben. 
Wir betrachten die Differenz 


k k 
P;;(n) — Pı;(n) = & Pi) P,(n — s) — & Pıds) -P,(n— 5) 


k 
= 2 [P6) — Pıds)] Prin — 5) . () 


Die positiven Differenzen P;,(s) — Pı,(s) bezeichnen wir mit £(, die nicht | 
positiven Differenzen mit — ß/. Nun ist | 


k k | 
ZP()=EPı4)=1, | 
1 r=1 
somit ergibt sich die Beziehung 
k 
z [Pir6s) — Pr] = & Pr? 2 PP=0. (2) 


Daraus folgt 
= Br? 2 PP. 


Da nach Voraussetzung für alle iundr (a,r=1,2,3,...,&k) P;,(s) > 0 ist, 
so gilt 
k 
zB < 2 Pk) =1, 
folglich ist 
0O<khu<li. 


Es sei 


h= max hı. 
1<i,1<k 


Da die Anzahl der möglichen Versuchsergebnisse endlich ist, so genügt die 
Größe h zusammen mit den Größen h;, der Ungleichung 


<h<1. (8) 
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Aus (1) finden wir für beliebige i und /(,!=1,2,...,k) 
[Pix(n) — P,j(n)| = [2 BR} Pıkn — s) — I BP P, (in — 9) 
Kr) (r) 


<| max P,;(n — s) 5 £f) — min P,,(n — s) 3 Bf 
1<rsk (r) 1<Sr <k r 


< Aus max ‚Priin — 5) — min „Prien _ 9) 
1<r< 


= hmax es — 5) — Pı(n — s)| 


1<i,i< 
und weiter 
i a [P; (n) — Pıj(n)| < r ER x [Pisa — 5) — Pı(n —s)| . 


Wenden wir diese Ungleichung ns an, so finden wir 


Ne [Pi (n) — Pıia)| < 
rel u-[el 


IP; ;(m) — P,,(m)| < 1 


= la) max 
1<i,1<k 


Da aber stets 


ist, so ist natürlich auch 


max Ip: ;in) — P,(n)| < le] 
1<si,Is 


Für n— oo strebt auch & gegen oo, daher ergibt sich hieraus auf Grund von 
(3) die Beziehung 
lim max Put) — P,(n)| =. 


n> oo 1<i,!I< 


Aus dem Bewiesenen schließen wir noch, daß 


k 
Zp=l 
j=-1 
ist, denn es ist 


En = lim R: P,;(n)=lim1=1. 
j=-1 n> X j= no 

Die Größen p; kann man also als die Wahrscheinlichkeiten für das Eintreten 
des Ereignisses AY im n-ten Versuch ansehen, wenn n groß ist. 

Der physikalische Sinn des bewiesenen Satzes ist klar: Die Wahrscheinlich- 
keit dafür, daß sich ein System im Zustand A, befindet, hängt praktisch 
nicht davon ab, in welchem Zustand es sich lange Zeit vorher befunden hat 
und strebt für n — oo gegen einen bestimmten Grenzwert. 
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Der letzte Satz wurde zuerst von A. A. Markow, dem Schöpfer der Theorie 
der kettenförmigen Abhängigkeiten, bewiesen; er bildete das erste streng 
bewiesene Resultat unter den sog. Ergodensätzen, die in der modernen Physik 
eine wichtige Rolle spielen. 

Man kann beweisen, daß der Ergodensatz gilt, wenn alle möglichen Zustände 
des Systems eine wesentliche Klasse bilden. 


$ 20. Verallgemeinerung des Satzes von Moivre-LarLace auf Folgen 
von Versuchen mit kettenförmiger Abhängigkeit 


Wir richten jetzt unsere Aufmerksamkeit auf Folgen von Versuchen, als 
deren Resultat das Ereignis E auftreten oder nicht auftreten kann. Wir setzen 
dabei voraus, daß die Versuche nicht unabhängig, sondern durch eine einfache 
Marxkowsche Kette miteinander verknüpft sind. Wenn beim Versuch mit der 
Nummer k das Ereignis E aufgetreten ist, so sei die Wahrscheinlichkeit dafür, 
daß im folgenden Versuch (mit der Nummer k + 1) von neuem das Ereignis E 
erscheint, gleich &; die Wahrscheinlichkeit dafür, daß im (k + 1)-ten Versuch 
das Ereignis E erscheint, sei gleich 1—«. Wenn aber beim Versuch mit der 


Nummer k das Ereignis E aufgetreten ist, so sei £ die Wahrscheinlichkeit 
für das Auftreten von E im (k + 1)-ten Versuch und 1 —ß die Wahrscheinlich- 
keit für das Auftreten von E im (k + 1)-ten Versuch. Die Übergangswahr- 
scheinlichkeiten sind daher in unserem Falle gegeben durch die Matrix 


F 1— ) 
pP 1—B 

Im weiteren setzen wir voraus, daß & und £ verschieden von O0 und 1 sind; 
anderenfalls liegt kein ernsthaftes Problem vor. Es versteht sich, daß unser 
Schema eine natürliche Verallgemeinerung des Schemas der unabhängigen 
Versuche ist, das von J. BERNOULLI untersucht wurde und das wir im vorher- 
gehenden Kapitel betrachtet haben. 

Durch die Angabe der Übergangsmatrix ist unsere Versuchsfolge noch nicht 
völlig bestimmt, da dem ersten Versuch kein anderer vorausgeht und infolge- 
dessen die Wahrscheinlichkeiten für das Auftreten der Ereignisse E und E im 
ersten Versuch noch unbestimmt sind. Wir bezeichnen daher mit p, die Wahr- 
scheinlichkeit des Erscheinens von E im ersten Versuch und durch , =1—pı 
die Wahrscheinlichkeit des Erscheinens von E im selben ersten Versuch. 

Wir lösen zunächst die beiden folgenden Aufgaben: 1. Die Wahrscheinlichkeit 
dafür zu finden, daß im k-ten Versuch das Ereignis E erscheint; 2. die Wahr- 
scheinlichkeit dafür zu finden, daß das Ereignis E im j-ten Versuch auftritt, 
wenn im i-ten Versuch (i < j) das Ereignis E erschien. 

Wir bezeichnen mit p; die Wahrscheinlichkeit für das Auftreten von E im 


k-ten Versuch und setzen g = 1—.p;. Offensichtlich kann im k-ten Versuch 
das Ereignis E auf zwei einander ausschließende Weisen auftreten: Im (k—1)-ten 
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Versuch kann nämlich schon das Ereignis E auftreten, das im k-ten Versuch 
wiederkehrt; es kann aber auch im (k—1)-ten Versuch das Ereignis E auftreten, 
worauf im k-ten Versuch das Ereignis E folgt. Nach der Formel von der totalen 
Wahrscheinlichkeit finden wir 
P=M-ıa + n-ıß- 
Wir setzen g_ı = 1— p;—ı und finden mit der Abkürzung d= a — ß 
PR=P-ıd+P: 

Insbesondere gilt bik=2 

P=Pö+ß 
und bik=3 

B=Ppö+ß=p®+rPi+D. 
Wie man leicht sieht, gilt bei beliebigem k > 1 
=p#+Bl+ö+ +) 


u sn M 
Unter unseren Voraussetzungen bezügich « und ß gilt |ö] < 1. Aus Gleichung (1) 
folgt daher bei k— oo 


De > - 
Bemerkenswert ist, daß der Limes von p; nicht von p, abhängt. Wir führen 
die Bezeichnungen 
Pegedig ia 
ein und können schreiben 
Pr=Pp+(pı—p) =". () 


Wir bezeichnen jetzt mit p" die Wahrscheinlichkeit für das Auftreten des 
Ereignisses E im j-ten Versuch, wenn dieses Ereignis schon im i-ten auftrat. 
Auf demselben Wege, den wir eben beschritten haben, kann man sich davon 
überzeugen, daß die Wahrscheinlichkeit pP für alle j>i +1 der Differen- 
zengleichung 

pP = PP, ö6+Pß 
genügt. Es ist aber pl}, =a, und daher finden wir wie im schon durchge- 
führten Beispiel 
h Pa Se 
PP =as-ıı Bl Lie an >; 7! (2) 
oder 
PP=p+gdt. (2) 
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Wir gehen jetzt über zur Berechnung der Wahrscheinlichkeit für das m-malige 
Auftreten des Ereignisses E unter n Versuchen. Zu diesem Zweck zerlegen wir 
die gesuchte Wahrscheinlichkeit, die wir wie früher mit P,(m) bezeichnen, in 
vier Summanden: 


P,(m) = P,(m, EE) + P,(m, EE) + P,(m, EE) + P,(m, EE). 


Der erste dieser Summanden bezeichnet die Wahrscheinlichkeit für das m- 
malige Erscheinen des Ereignisses E in n Versuchen unter der Bedingung, daß 
beim ersten und beim letzten Versuch E auftritt. Die Bedeutung der übrigen 
Summanden ist jetzt ohne weitere Erläuterung klar. Zur Berechnung von 
P„(m, EE) betrachten wir zunächst die folgende Anordnung der Versuchs- 
ergebnisse: 


in den ersten r, Versuchen erscheint das Ereignis E, 
in weiteren s, Versuchen erscheint das Ereignis E, 


in weiteren 7, Versuchen erscheint das Ereignis E, 


Tr Tr Tr ee — Pau Ber vr Bu Br Br 


in weiteren s,_, Versuchen erscheint das Ereignis E, 
in weiteren 7; Versuchen erscheint das Ereignis E. 
Die Wahrscheinlichkeit dieses Versuchsergebnisses ist, wie man leicht sieht, 


Pat —a) (L—BT1B...B-a" 
= Pı g ++. : «+7 —k da — a)E—1 (1 ne RAT x 


Wegen 
k k—1 
£u=m, £s=n—m 
i=1 i=1 


ist dıese Wahrscheinlichkeit gleich 

Pı am—k (di = ) de [61 DT | en 1 ai . 
Sie hängt also nur von ın, n und k, nicht aber von den Zahlen r; und s, ab. 
Da die Zahl m auf C#', verschiedene Weisen in k ganzzahlige positive Sum- 


manden,undn—maufC}_2,_, verschiedene Weisen in k— 1 positive ganzzahlige 
Summanden zerlegt werden kann, so ist die Wahrscheinlichkeit für das m-malige 


Auftreten des Ereignisses E, wobei E in k Gruppen und E in (k — 1) Gruppen 
erscheint, gleich 


EL RT und Ed U ET ad u 
Da k einen beliebigen Wert zwischen 2 und m annehmen kann, gilt 
m 
P,(m, EE) = p 3 CZ (1 - u, Amir, 
k=2 


9 Gnedenko 
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Auf ähnliche Weise finden wir 


P,(m, EE) = pı 5; ar (1 — oo) Zu Een, 
k=1 

P,(m EE) = q, B> aaa — A U — Bet, 
k=1 


P„(m, EE) — m 2 he d— ap BI (1— pre p* : 


Zur Abschätzung dieser vier Wahrscheinlichkeiten betrachten wir den Aus- 


druck PR 
Aun= EZ Kart (1 —a) Ch_„ (1 — BIER 
k=1 


und führen die Variablen z, u, v durch 


m=np+ mn, PN 
k=m(l—o)+uyma(ll—o), k=(n—m)ß+vyn—m)ß (1 —P) 
ein. Die Rechnung führen wir unter der Voraussetzung 
u=o(m!%), v=o(n) 
durch, wo y eine Zahl ist, die den Ungleichungen 0 <y< 1/6 genügt. Die 
Größe A„„ zerlegen wir in drei Summanden 


Ann=Lı +22 + 2% 
indem wir setzen 


Az ’ : Sa & ’ 
k=1 k=m(1—-a)— u/mall—a) | 
m 
Ke B>) | 
k=m(1—e) +1m/mall—a) 

Wir behandeln zuerst die mittlere Summe. Indem wir wörtlich die Überlegun- 
gen wiederholen, die uns zum Beweis des lokalen Satzes von MoIVRE-LAPLACE 
führten, finden wir 


Cor: 1 —o) = Er = Fl+nd, 


1 


End Br ——  — 
AD Y2rB(l—P)(n—m) 


Die Größen w, und w, sind innerhalb der gewählten ‚Grenzen unendlich klein.!) 


m(1—.)—u,Yma(1—a) m(1—a) + m /ma(1—o) 
5 zZ, P 


Fa +0). 


1) Der in $ 12 angegebene Beweis dieses Satzes zeigt nämlich, daß die dort verwendeten 
Variablen x; nicht notwendig beschränkten Intervallen (a; , b;) angehören müssen und daß 
der Satz auch noch unter den hier für u bzw. v getroffenen weiteren Voraussetzungen gilt 
(Anm. d. Red.). 


$20. Verallgemeinerung des Satzes von MoIVRE-LArLAcE... 117 


Daher gilt 
u + vu 


SC TEL AR EEDSERGHEN. VEREOREESSHERGTRE N 2 (4q ’ 1 » 
— mean. ++. 


Nun ist aber 


1 4ı u +! _ + 
DIEHERN. SPRSENE 2 2 d 1 U 


und daher 
u + 


2 du(l+o,). 


1 2 
Pre Terror; [: 


Da u, zusammen mit n gegen oo strebt, kann man schreiben 
u“ + 
® du(l+®,). 


1 — 
— GPRRER EEE EEE e 
2 22 Y(n — m) B(1—B) j 
rn} 
Nach Definition sind u und v durch die Relation 


m(l—a) $Ruyma(l—o) = (n— m)ß + vyY(n—m)B (1 —P) 


miteinander verknüpft. Setzt man hier m gemäß (3) ein, so folgt nach offen- 
sichtlichen Vereinfachungen 


zYma(1—a) + (n— m)ß (1—P) + uyma(1—a) =v Y(n — m) B(L—P) 


oder 


v Sn mat) + (a— m) BL —P) + uyma(1—o)]. 


Daher gilt 
a RE ma(l—a) +(n— m)B(1—P) 
Se m—m)BU—p) 
ma (1 — 6) u 
4 rn | 


und folglich 


1 
2,= Verlma (1 —a) + (a— m)B(L —B)] 
Nach (3) gilt 
ma(l—o) + (n—m)B(l—P)=npa(l—o) +ngß(1—P) + O(zyn) 
=npq(l+a—B)(l—a+P) +0O(zyr), 
und so erhalten wir 


z 
1 a — 
2 me 214): 

®: Vernpgll+a—PA)(1—a+B) arm 


? 
e?(1+@,)- 


9* 
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Zur Abschätzung der Summe 2, führen wir die Bezeichnung 
= Cham (1 — a) Ci_n (1 rnit 
ein. Der Quotient 
u _ @+n% “(1 —P) 
w+ı (m—i)(n—m—i) (1—o)Pß 
wächst mit wachsendem i und bleibt für nicht zu großes i kleiner als 1. Es sei 
j=m(l—o)— ı.yma(l wi y=u,d_ 1 =U_, 9—1- x und für 
i=1, ‚I-2 = 1,0 9 
Natürlich ist 


A<m + +. +09,<p I» 
Nach unseren früheren Berechnungen gilt 

u 
u 77 


mm ———— £ 1 1 u); 
I A+o)(l+o) 


v, = 


und esist 2 < = für genügend großes n; daher ist 


= o(l). 
Auf ähnlichem Wege überzeugt man sich, daß 
23,= 0o(l). 


Der Summand 2, ist also für A,(m) bestimmend. Der Vergleich von A,„(m) mit 
den gesuchten Wahrscheinlichkeiten führt auf 


” 
Bl BE BP — 4 Eh, 
her = 2n[ma(1—o) + (n — m) B (1 — B)] € ( Tan 


2’ 
Din Rn IH ae, 
Ir lmall—o) + m —mPı—P)] 


z* 
Pin Ehe Hub _ —_ - FE; 
= ) 2n[ma(1—a)-- (n— m) (1 — B)] i EM 


z* 
BinERBm HER FE, 
2r [ma (1—a) + (m —m)B(L—B)] 


Durch Addition dieser Ausdrücke folgt 


i =. 
Pak) = —— Ft a). 
RE Senden 
1—a+ß 


Damit ist der lokale Satz bewiesen. 
Wenn für die Übergangswahrscheinlichkeiten x und ß die Gleichung « = ß 
gilt, so geht das Schema der Versuche, zwischen denen eine kettenförmige 
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Abhängigkeit besteht, in das BerxourLische Schema über, und unser Satz ist 
kein anderer als der von MoIVRE-LAPLACEH. 

Aus dem lokalen Satz kann man auf dem üblichen Wege auch den folgenden 
Integralgrenzwertsatz gewinnen: 

Bei beliebigen z,, 2, gilt 


. pn 
m—np ı (— 

Plz < —————<„?= — je ?d-+o,. 
y ET a) TR 
nDg ———— z 

1—a+Bß 1 


Die Größe w, strebt mit wachsendem n gleichmäßig bezüglich z, und z, gegen 
Null. 


Übungen 
1. Die Übergangswahrscheinlichkeiten seien durch die Matrix 

1 1 5 

3 4 12 

ai 3 15 

“3 7 DB 

1 1 5 

„3, 22 


gegeben. Wie groß ist die Anzahl der Zustände? Man bestimme die Übergangswahr- 
scheinlichkeiten nach zwei Schritten. 


2. Ein Elektron kann sich in Abhängigkeit von der Energie auf einer von abzählbar vielen 
verschiedenen Bahnen befinden. Es geht von der i-ten Bahn in die j-te im Verlauf 
einer Sekunde mit der Wahrscheinlichkeit c; e-@li—jl über. Man bestimme a) die Wahr- 
scheinlichkeiten für den Übergang im Verlauf von zwei Sekunden, b) die Konstanten c;. 


3. Die Übergangswahrscheinlichkeiten seien durch die Matrix 


o1Lı 

Pr 
u N 
2 2 
r 3 
u 
2 2 


gegeben. Ist in diesem Falle der Ergodensatz von MArkow anwendbar? Wenn ja, 
dann bestimme man die Grenzwahrscheinlichkeiten. 


IV. 


ZUFALLSGRÖSSEN UND VERTEILUNGSFUNKTIONEN 


821. Grundeigenschaften der Verteilungsfunktionen 


Einer der grundlegenden Begriffe der Wahrscheinlichkeitsrechnung ist der 
Begriff der Zufallsgröße. Bevor wir ihre formale Definition angeben, bringen 
wir einige Beispiele. 

Die Anzahl der kosmischen Teilchen, die im Verlaufe eines bestimmten Zeit- 
abschnitts auf einen bestimmten Teil der Erde auftreffen, ist in Abhängigkeit 
von vielen zufälligen Faktoren merklichen Schwankungen unterworfen. 

Die Zahl der Anrufe von Fernsprechteilnehmern innerhalb einer bestimmten 
Zeit ist ebenfalls eine Zufallsgröße und nimmt den einen oder den anderen 
Wert in Abhängigkeit von mannigfachen zufälligen Umständen an. 

Der Abstand des Treffpunktes eines Geschosses vom Mittelpunkt einer Ziel- 
scheibe ist durch eine große Anzahl verschiedener Ursachen bestimmt, die 
einen zufälligen Charakter tragen. Im Enderfolg muß man beim Schießen 
mit einer Streuung des Geschosses in der Umgebung des Zieles rechnen und 
die Abweichungen als Zufallsgrößen ansehen. 

Die Geschwindigkeit eines Gasmoleküls ist nicht unveränderlich, sondern sie 
ändert sich in Abhängigkeit von Zusammenstößen mit anderen Molekülen. Die 
Anzahl dieser Stöße kann auch innerhalb eines sehr kurzen Zeitintervalls recht 
beachtlich sein. Wenn man die Geschwindigkeit eines Moleküls in einem 
gegebenen Zeitpunkt kennt, so kann man nicht mit voller Bestimmtheit 
ihren Wert — sagen wir — nach 0,01 oder nach 0,001 sek angeben. Die Ge- 
schwindigkeitsänderung der Moleküle trägt einen zufälligen Charakter. 

Diese Beispiele zeigen in hinreichendem Maße, daß man es in den verschie- 
densten Gebieten der Wissenschaft und der Technik mit Zufallsgrößen zu tun 
hat. Es ergibt sich also die natürliche und dabei sehr wichtige Aufgabe, Me- 
thoden zur Untersuchung von Zufallsgrößen zu erarbeiten. 

Trotz der Vielfalt des konkreten Inhalts der von uns angeführten Beispiele 
sind sie jedoch vom mathematischen Standpunkt aus gesehen alle von der 
gleichen Bauart. Denn in jedem Beispiel haben wir es mit einer Größe zu 
tun, die auf die eine oder andere Weise die zu untersuchende Erscheinung 
charakterisiert. Jede dieser Größen ist unter dem Einfluß zufälliger Umstände 
verschiedener Werte fähig. Man kann nie vorhersagen, welchen Wert die 
Größe annehmen wird, da sie sich ganz zufällig von Versuch zu Versuch ändert. 

Um nun über eine Zufallsgröße Bescheid zu wissen, ist es vor allem nötig, 
die Werte zu kennen, die sie annehmen kann. Doch der Wertevorrat einer Zufalls- 
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größe reicht allein noch nicht aus, um wesentliche Aussagen über sie zu machen. 
Betrachtet man nämlich im dritten Beispiel das Gas bei verschiedenen Tempe- 
raturen, so bleiben die an sich möglichen Geschwindigkeiten der Moleküle die- 
selben, während der Zustand des Gases jedesmal ein anderer ist. Zur Vorgabe 
einer Zufallsgröße genügt es also nicht allein zu wissen, welche Werte sie 
annehmen kann, sondern man muß auch wissen, wie oft, d.h., mit welcher 
Wahrscheinlichkeit sie diese Werte annimmt. 

Die Vielfalt der Zufallsgrößen ist sehr groß. Die Anzahl der von ihnen an- 
genommenen Werte kann endlich, abzählbar oder auch überabzählbar sein; die 
Werte können diskret verteilt sein oder ein Intervall ganz ausfüllen oder in 
einem Intervall überall dicht liegen, ohne dieses Intervall ganz auszufüllen. 
Um die Wahrscheinlichkeiten der Werte der Zufallsgrößen — so verschieden- 
artig diese auch sein mögen — durch ein und dasselbe Verfahren wieder- 
geben zu können, führt man in der Wahrscheinlichkeitsrechnung den Begriff 
der Verteilungsfunktion einer Zufalisgröße ein. 

Es sei &£ eine Zufallsgröße und x eine beliebige reelle Zahl. Die Wahrschein- 
lichkeit dafür, daß £ einen Wert annimmt, der kleiner als x ist, nennt man 
die Verteilungsfunktion der Wahrscheinlichkeiten der Zufallsgröße & 

Fe) =Pf{E<r}. 

Im folgenden werden wir in der Regel Zufallsgrößen mit griechischen und 
die von ihnen angenommenen Werte mit lateinischen Buchstaben bezeichnen. 

Fassen wir noch einmal zusammen: Eine Zufallsgröße ist eine Größe, deren 
Werte vom Zufall abhängen und für die eine Wahrscheinlichkeitsverteilungs- 
funktion existiert.) 

Wir betrachten nun einige Beispiele von Verteilungsfunktionen. 

Beispiel 1. Wir bezeichnen mit # die Anzahl des Eintretens eines Ereig- 
nisses A in einer Folge von n unabhängigen Versuchen, die Wahrscheinlichkeit 
für das Eintreten des Ereignisses A sei bei jedem Versuch konstant und gleich p. 
In Abhängigkeit vom Zufall kann u alle ganzzahligen Werte von 0 bis n ein- 
schließlich annehmen. Auf Grund der Ergebnisse des Kapitels II ist 


P,(m) = P{u=m} = xp" g"=", 
Die Verteilungsfunktion der Größe u ist folgendermaßen definiert 
0 für z<0, 
Fa) =? ZP,k) für O<ae<sı, 
k<z 
1 für i>n. 


Die Verteilungsfunktion ist also eine Treppenfunktion mit Sprüngen in den 
Punkten x =0,1,2,...,n; der Sprung im Punkt x = k beträgt P,(k). 

Dieses Beispiel zeigt, daß auch das sog. Bernouruische Schema in die all- 
gemeine Theorie der Zufallsgröße einbezogen werden kann. 


1) Auf Seite 122 findet man eine mehr formalisierte Definition einer Zufallsgröße. 
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Beispiel 2. Eine Zufallsgröße & möge die Werte 0, 1,2,... mit den Wahr- 
scheinlichkeiten 


PrR=Pl£=n)= 


Im e—. 


n! 


annehmen, A>0 sei dabei eine Konstante. Die Verteilungsfunktion der 
Größe £ stellt eine Treppe mit unendlich vielen Stufen, mit Sprüngen in allen 
nichtnegativen ganzzahligen Punkten dar. Die Größe des Sprunges im Punkt 
z=nist gleich p,; füre <0 ist F(z) = 0. Von der in diesem Beispiel be- 
trachteten Zufallsgröße £ sagt man, sie sei nach dem Poıssonschen. Gesetz 
verteilt. 


Beispiel 3. Wir nennen eine Zufallsgröße normal verteilt, wenn ihre Ver- 
teilungsfunktion die Gestalt 


(a)! 


Ö(z) = je ed 


hat, wobei C>0, o>0 und a Konstante sind. Wir werden später einen 
Zusammenhang zwischen den Konstanten C und o herstellen und die wahr- 
scheinlichkeitstheoretische Bedeutung der Parameter a und o erklären. Normal 
verteilte Zufallsgrößen spielen in der Wahrscheinlichkeitsrechnung und in ihren 
Anwendungen eine überaus wichtige Rolle. Wir werden uns davon noch bei 
vielen Gelegenheiten überzeugen können. 

In den ersten beiden Beispielen konnten die Zufallsgrößen nur endlich oder 
abzählbar viele Werte annehmen (diskrete Größen). Die nach dem normalen 
Gesetz verteilten Zufallsgrößen können hingegen Werte aus jedem beliebigen 
Intervall annehmen. Wie wir nämlich später sehen: werden, ist die Wahr- 
scheinlichkeit dafür, daß eine normal verteilte Zufallsgröße Werte aus dem 
Intervall x, <x < x, annimmt, gleich 


(e—a)* 


Da) — Ba)=C[e ** d 
& 


sie ist also bei beliebigen x, und z, (x, # &,) positiv. 

Nach diesen vorbereitenden Bemerkungen mehr intuitiven Charakters kom- 
men wir nun zu einer streng formalen Festlegung des Begriffs einer Zufalls- 
größe. 

Bei der Definition der Zufallsgröße gehen wir in Anlehnung an den allge- 
meinen Begriff des zufälligen Ereignisses von der Menge U der elementaren 
Ereignisse aus. Jedem elementaren Ereignis e ordnen wir eine Zahl 


&=f(e) 
Zu. 


Wir nennen & eine Zufalisgröße, wenn die Funktion /(e) bezüglich der in 
der Menge U eingeführten Wahrscheinlichkeit meßbar ist. Anders ausgedrückt 
fordern wir, daß für jede Borer-meßbare Menge A, von Werten £ die Menge 


$21. Grundeigenschaften der Verteilungsfunktionen 123 


A, der e mit f(e) < A, zur Menge F der zufälligen Ereignisse gehört, so daß 
also für sie eine Wahrscheinlichkeit 


P{£c A} =P{A} 


definiert ist. Fällt insbesondere die Menge A, mit der Halbgeraden &< x 
zusammen, so ist die Wahrscheinlichkeit P{A,} eine Funktion der Veränder- 
lichen x 


P{f£<2}=P{A}=F@), 
die wir die Verteilungsfunktion der Zufallsgröße & nannten. 


Beispiel 4. Wir betrachten wieder eine Folge von n unabhängigen Ver- 
suchen. In jedem dieser Versuche sei die Wahrscheinlichkeit des Eintretens 
eines Ereignisses A konstant und gleich p. In diesem Beispiel bestehen die 
elementaren Ereignisse aus allen Möglichkeiten des Eintretens oder Nicht- 
eintretens der Ereignisses A in n Versuchen. Eines der elementaren Ereig- 
nisse besteht z.B. darin, daß das Ereignis A in jedem Versuch auftritt. Im 
ganzen gibt es, wie man leicht nachrechnet, 2” elementare Ereignisse. 

Wir definieren die Funktion u = f(e) des elementaren Ereignisses e folgender- 
maßen: Sie sei gleich der Anzahl des Auftretens des Ereignisses A im elemen- 
taren Ereignis e. Nach den Ergebnissen des Kapitels II ist 


P{n=k}= P,(k) = Chpk gt. 


Die Meßbarkeit der Funktion u = f(e) im Wahrscheinlichkeitsfeld ist unmittel- 
bar klar. Hieraus schließen wir nach unserer Definition, daß » eine Zufalls- 
größe ist. 


Beispiel 5. Es werden drei Beobachtungen der Lage eines sich auf einer 
Geraden bewegenden Moleküls ausgeführt. Die Menge der elementaren Er- 
eignisse besteht aus den Punkten des dreidimensionalen euklidischen Raumes R,. 
Die Menge der zufälligen. Ereignisse F besteht aus den Borzrschen Mengen 
des Raumes R,. 

Für jedes zufällige Ereignis A definieren wir die Wahrscheinlichkeit P{A} 
mit Hilfe der Gleichung 


1 
ME Ha! —a)"] 
ta) || ee 
(eY2 =)? 
A 


Wir betrachten nun die Funktion & = fe) des durch die Gleichung 
1 
= 3 ++) 


definierten elementaren Ereignisses e = (X,, 2, 25). Diese Funktion ist bezüglich 
der eingeführten Wahrscheinlichkeit meßbar, & ist daher eine Zufallsgröße. 
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Ihre Verteilungsfunktion ist gleich 


Fa) = PlE<E)= gen If ET ae, 


atat+r<Ir 
1 7 _ Meza)' 
= —— e ae 
o Fe [ 
3 


Von dem eben entwickelten Standpunkt aus laufen die Operationen an 
Zufallsgrößen auf bekannte Operationen mit Funktionen hinaus. Sind &, und 
&, Zufallsgrößen, d. h., sind bezüglich der eingeführten Wahrscheinlichkeit die 
Funktionen 


=); &, = fa(e) 


meßbar, so ist auch eine beliebige Boresche Funktion dieser beiden eine 
Zufallsgröße. Z. B. ist 


= +& 


bezüglich der eingeführten Wahrscheinlichkeit meßbar und daher eine Zufalls- 
größe. 

In $24 kommen wir hierauf noch einmal zurück und leiten eine Reihe für 
die Theorie und die Anwendungen wichtiger Resultate ab. Insbesondere werden 
wir dort eine Formel für die Verteilungsfunktion einer Summe auf Grund der 
Verteilungsfunktionen der Summanden gewinnen. 

Mit Hilfe der Verteilungsfunktion einer Zufallsgröße & kann man nun bei 
beliebigen x, und x, die Wahrscheinlichkeit für die Ungleichung 5 sE<z, 
angeben. Bezeichnet man mit A das Ereignis, welches darin besteht, daß & Werte 
kleiner als z, annimmt, mit B das Ereignis, welches darin besteht, daß & < x, ist, 
und schließlich mit C das Ereignis x, <£<z,, so besteht offensichtlich die 
folgende Gleichung 

A=B+HC. 


Da die Ereignisse B und C unvereinbar sind, gilt 


P(A) = P(B) + P(C). 
Nun ist aber 
P(A)=Fa), PB=Fa), O=P{m<i<zm}, 
daher ist 
P{n <S$<2}= Fin) — Fi). () 
Da definitionsgemäß die Wahrscheinlichkeit eine nichtnegative Zahl ist, so 
ergibt sich aus der Gleichung (1), daß bei beliebigen x, und 2, (% > z,) die 


Ungleichung 
F(&) > Fa) 
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besteht, d. h., die Verteilungsfunktion einer beliebigen Zufallsgröße ist eine mono- 
tone nichtfallende Funktion. 
Ferner genügt offenbar bei beliebigen x die Verteilungsfunktion F(x) der 
Ungleichung 
0<F(a)<i. (2) 


Wir sagen, eine Verteilungsfunktion F(x) besitze an der Stelle x = x, einen 
Sprung, wenn 
F&, +) —- Fo, —)=C,>0 
ist, 
Eine Verteilungsfunktion kann höchstens abzählbar viele Sprungstellen be- 
sitzen. Sie kann nämlich höchstens einen Sprung besitzen, der größer als 


+ ist, sie kann nicht mehr als drei Sprünge besitzen, deren Größe zwischen 
+ und + schwankt (7 <CG,=s 3)- Allgemein kann sie von den Sprüngen 


zwischen | und nicht mehr als 2°—1 besitzen. Es ist dann ganz klar, 


1 
2% An-1 
daß wir alle Sprünge numerieren können, indem wir sie, angefangen von den 
größten Werten, der Größe nach anordnen; gleiche Werte werden so oft wieder- 
holt, wie sie als Sprünge der Verteilungsfunktion F(x) auftreten. 
Wir stellen nun noch einige allgemeine Eigenschaften der Verteilungsfunk- 
tionen zusammen. Wir definieren F(—oo) und F(-+o0) durch die Gleichungen 


F(—oo) = lim F(-n), F(+0o0) = lim F(+n) 
n>+% n>%X 


und beweisen, daß 
F—-o)=0, F+o)=1 
ist. 
Die Ungleichung & < + ooist sicher erfüllt, daher ist 
Wir bezeichnen nun mit Q, das Ereignis k—1<£&<k. Da das Ereignis 
€E< + oo mit der Summe der Ereignisse Q; äquivalent ist, so ist auf Grund 
des erweiterten Additionsaxioms 


P{&< + 00} - ZA). 
Folglich ist für n — © 
E: P{Q)=, & [F() — F(k— 1)] = Fin) — F-n)>1. 


Beachtet man hierbei die Ungleichung (2), so gewinnt man für n — oo die 
Beziehungen 
F—n) —0, F+n) —1i. 


Eine Verteilungsfunktion ist linksseitig stetig. 
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Wir wählen eine beliebige monoton wachsende Folge 


H<au<m<r <m<e" 
aus, die gegen x konvergiert. 

Mit A, bezeichnen wir das Ereignis {z,<£<r}. Dann ist für i>j 
A;<A; und das Produkt aller Ereignisse A, ist das unmögliche Ereignis. 
Auf Grund des Stetigkeitsaxioms muß 

lim P(A,) = lim { F(x) — F(x,)} = F(x) — lim F(x,) 
n>%X0 280 


Nn>0oo 
= F(x) — Fir —0) = 0 
sein, q. e. d. 
Genauso kann man beweisen, daß 
P{ff<2}=F@+0) 
ist. 

Wir sehen also, daß jede Verteilungsfunktion eine monotone nichtfallende, 
linksseitig stetige Funktion ist, dieden Bedingungen F(—oo) = Ound F(+x)=1 
genügt. Es gilt auch die Umkehrung: Jede Funktion, die den aufgezählten 
Bedingungen genügt, läßt sich als Verieilungsfunktion einer Zufallsgröße deuten. 

Während jedoch jede Zufalisgröße ihre Verteilungsfunktion eindeutig fest- 
legt, gibt es beliebig viele verschiedene Zufallsgrößen, die ein und dieselbe 
Verteilungsfunktion besitzen. Nimmt z.B. & jeden der beiden Werte +1 und 


—1 mit der Wahrscheinlichkeit + an und ist = —£, so ist doch sicherlich 


immer & verschieden von n. Trotzdem besitzen beide Zufallsgrößen ein und 
dieselbe Verteilungsfunktion 


0 fü 2<—1, 
Fix) = 5 für —i22<1, 


1 für 2>1. 
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Manchmal charakterisiert man das Verhalten einer Zufallsgröße nicht durch 
Vorgabe ihrer Verteilungsfunktion, sondern auf irgendeine andere Art. Jede 
solche Charakterisierung heißt ein Verteilungsgesetz der Zufallsgröße, wenn es 
möglich ist, nach bestimmten Regeln aus ihr die Verteilungsfunktion zu be- 
stimmen. Ein solches Verteilungsgesetz ist z. B. die Intervallfunktion P{:x,, 22}; 
welche die Wahrscheinlichkeit der Ungleichung &, <&< x, angibt. Kennt 
man P{x,,2,}, so kann man nach der Formel 

F(&) = P{— oo,:} 
die entsprechende Verteilungsfunktion aufstellen. Wir wissen bereits, daß man 
bei beliebigen x, und 2, auch die Funktion P{x,x2,} aus F(x) finden kann: 


P{z, 2%} = Fa) — F@). 
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Es erweist sich häufig als zweckmäßig, als Verteilungsgesetz die Mengen- 
funktion P{E} zu nehmen, die für alle Boreschen Mengen definiert ist und 
die Wahrscheinlichkeit dafür angibt, daß die Zufallsgröße & einen Wert an- 
nimmt, der zur Menge E gehört. Die Wahrscheinlichkeit P{E} ist auf Grund 
des erweiterten Additionsaxioms eine volladditive Mengenfunktion, d. h., läßt 
sich E als Vereinigung endlich oder abzählbar vieler paarweise disjunkter 
Mengen E, darstellen, so ist 


P(E)= & P{Eı}. 


Aus der Vielfalt der Zufallsgrößen wählen wir zunächst solche aus, die nur 
endlich oder abzählbar viele Werte annehmen können. Solche Größen wollen 
wir diskrete Zufallsgrößen nennen. Eine diskrete Zufallsgröße & möge mit 
positiven Wahrscheinlichkeiten die Werte x,,2,, 7,,... annehmen.!) Um die 
Größe £ wahrscheinlichkeitstheoretisch vollständig zu charakterisieren, genügt 
es, die Wahrscheinlichkeiten p; = P{£ = z,} zu kennen. Mit Hilfe der Wahr- 
scheinlichkeiten p, kann man offenbar die Verteilungsfunktion F(x) durch die 
Gleichung 

F@)= 2 Pı 
gewinnen, dabei wird die Summe über alle Indizes erstreckt, für die 2, <x 
ist. 

Die Verteilungsfunktion einer beliebigen diskreten Größe ist unstetig, sie 
wächst mit Sprüngen an denjenigen Stellen x, die mögliche Werte von & sind. 
Die Größe des Sprunges von F(x) an der Stelle x ist — wie wir schon früher 
erläuterten — gleich der Differenz F(x + 0) — F(x). 

Sind zwei mögliche Werte der Größe & durch ein Intervall voneinander ge- 
trennt, in dem keine anderen möglichen Werte £ liegen, so ist in diesem Inter- 
vall die Verteilungsfunktion F(x) konstant. Besitzt & endlich viele mögliche 
Werte, z.B. n, so stellt die Verteilungsfunktion eine Treppenfunktion mit 
n + 1 Konstanz-Intervallen dar. Hat jedoch £ abzählbar viele mögliche Werte, 
so können diese auch überall dicht liegen, so daß die Verteilungsfunktion 
eventuell überhaupt kein, Konstanz-Intervall besitzt. Zum Beispiel besitze & 
als mögliche Werte alle rationalen Zahlen und nur diese. Diese Zahlen seien 
irgendwie numeriert: r, r,... und die Wahrscheinlichkeiten P{£ = r,} = pı 


seien durch die Gleichung P=% definiert. In diesem Beispiel sind alle 


rationalen Punkte Unstetigkeitsstellen der Verteilungsfunktion. 
Als zweite wichtige Klasse von Zufallsgrößen sondern wir die Größen aus, 
für die eine nichtnegative Funktion p(x) existiert, die für alle x der Gleichung 


F(x) -/ p(z) dz 


genügt. Zufallsgrößen mit dieser Eigenschaft wollen wir sielig nennen. Die 
Funktion p(2) heißt die Dichte der Wahrscheinlichkeitsverteilung. 


1) Diese und nur diese Werte x, nennen wir mögliche Werte der diskreten Zufallsgröße £. 
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Die Wahrscheinlichkeitsdichte besitzt die folgenden Eigenschaften: 
1.p@) >0. 
2. Sie genügt bei beliebigen x, und x, der Gleichung 


Pin <e2<2)=[pa)dr. 
2 


Ist insbesondere p(x) im Punkte x stetig, so ist bis auf unendlich kleine Größen 
höherer Ordnung P{zx <& <x + de} = pl(a) dr. 


3. fp@) d=1. 


Beispiele stetiger Zufallsgrößen sind die normal und gleichmäßig verteilten 
Größen.!) 

Beispiel. Wir wollen das Normalgesetz etwas näher betrachten. Seine 
Wahrscheinlichkeitsdichte ist gleich 


(a)! 
20 


p@)=C-e 


Die Konstante C läßt sich mit Hilfe der Eigenschaft 3 bestimmen. Es ist 


nämlich 
(a—a)" 


cCle "&=-1. 


"Z =2z bringen wir die Gleichung auf 


Durch die Variablensubstitution 


die Form 
BR 
Co [ e "k=1. 
Das Integral auf der linken Seite dieser Gleichung ist unter dem Namen 
Poıssonsches Integral bekannt; es ist 
z 
f e *?dz=V2n. 
Wir finden also 
1 


even 


C= 


Folglich gilt für die normale Verteilung 
1 _(aa)' 
= ——e ?*. 
P@) ee 


Die Funktion P(x) besitzt ein Maximum an der Stelle x = a und Wende- 
punkte an den Stellen x= a + o. Die Abszissenachse ist ihre Asymptote für 


ı) Eine Zufallsgröße heißt gleichmäßig verteilt, wenn ihre Verteilungsfunktion in einem 
gewissen Intervall (a, b) linear von 0 bis 1 wächst, links vom Punkt a gleich Null und 
rechts von b gleich Eins ist. 
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z-> + 00. Um den Einfluß des Parameters o auf die Gestalt der Kurve der 
Wahrscheinlichkeitsdichte zu veranschaulichen, stellen wir in Abb. 14 den Ver- 


lauf von p(a) frra=0 undil.® = + ‚2.0?=1,3.0?=4 dar. Wir sehen, 


je kleiner der Wert o ist, desto größer ist das Maximum von p(x) und desto 
schärfer fällt die Kurve p(z) ab. Dies besagt insbesondere, daß für zwei normal 
verteilte Zufallsgrößen mit dem Parameter a = 0 die Wahrscheinlichkeit für 
das Auftreten eines Wertes aus dem Intervall (— «, «) für diejenige Zufalls- 
größe größer ist, die das kleinere o hat. Wir können o also als ein Maß dafür 


Abb. 14 


ansehen, wie verstreut die Werte der Größe & liegen. Für a #0 gehen die 
Kurven der Wahrscheinlichkeitsdichten alle genauso aus, sie sind nur in Ab- 
hängigkeit vom Vorzeichen des Parameters a nach rechts (a > 0) oder nach 
links (a < 0) verschoben. 

Neben den diskreten und den stetigen Zufallsgrößen gibt es natürlich noch 
andere Zufallsgrößen. Außer den Größen, die sich in einigen Intervallen stetig, 
in anderen Intervallen diskret verhalten, gibt es noch Größen, die in keinem 
Intervall diskret oder stetig sind. Zu diesen Zufallsgrößen zählen z.B. alle 
die, deren Verteilungsfunktionen stetig sind, jedoch nur auf einer Menge vom 
Lesesauzschen Maß Null wachsen. Als Beispiel führen wir die Zufallsgröße & 
an, deren Verteilungsfunktion die bekannte Cantorsche Kurve ist. Wir wollen 
uns kurz an ihre Konstruktion erinnern. Die Größe £ nimmt nur Werte zwischen 
Null und Eins an. Folglich genügt ihre Verteilungsfunktion den Gleichungen 


Fa)=0 für z<s0, Fa)=1 für .r>1. 
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Innerhalb des Intervalls (0, 1) nimmt £ nur Werte im ersten und dritten Drittel 
an, in jedem mit der Wahrscheinlichkeit 5. Folglich ist 


Fa)=4 für I<2<}. 


In den Intervallen (0 5) und (7 1) nimmt £ wiederum nur Werte im ersten 


und dritten Drittel an, diesmal mit der Wahrscheinlichkeit —. Damit ist 


die Funktion F(x) in zwei weiteren Intervallen bestimmt: 


FREE NEE 2 

Fo)=-Z für 7 IST 
3 4 7 8 

F@Q)=-7 für F<tSsz- 


Weiter wird in jedem der übrigen Intervalle dasselbe Verfahren wiederholt und 
bis ins Unendliche fortgesetzt. Schließlich ist die Funktion F(x) auf abzählbar 
vielen Intervallen definiert. Übriggeblieben ist auf dem Intervall (0, 1) nur 
eine nirgends dichte perfekte Menge vom Maß Null. Auf diese Menge setzen 
wir die Funktion F(x) stetig fort. Die Größe & ist somit nicht durch eine dis- 
krete Verteilungsfunktion bestimmt, da die Verteilungsfunktion stetig ist, 
gleichzeitig ist aber auch & nicht stetig, da ihre Verteilungsfunktion nicht das 
Integral ihrer Ableitung ist. 

Alle hier eingeführten Definitionen lassen sich leicht auf den Fall der be- 
dingten Wahrscheinlichkeiten übertragen. Besitzt z.B. ein Ereignis B eine 
positive Wahrscheinlichkeit P(B) > 0, so nennen wir die Funktion 


F(z]JB) =P{&<ıj/B} 
die bedingte Verteilungsfunktion der Zufallsgröße & unter der Bedingung B. 


F(x/B) besitzt offensichtlich alle Eigenschaften einer gewöhnlichen Verteilungs- 
funktion. 


$ 23. Mehrdimensionale Verteilungsfunktionen 


Für das Folgende brauchen wir neben dem Begriff der Zufallsgröße den 
Begriff des Zufallsvektors oder — wie man häufig sagt — einer mehrdimen- 
sionalen Zufallsgröße. 

Ordnet man jedem elementaren Ereignis e einen Punkt des n-dimensionalen 
euklidischen Raumes 


4 =hld; = Is(e) ET In(e) 


zu und ist jede der Funktionen f(e) (k=1,2,...,n) meßbar bezüglich der 
in der Menge F der zufälligen Ereignisse eingeführten Wahrscheinlichkeit, so 
heißt die Gesamtheit der Zahlen (&,,&,...,&,) eine n-dimensionale Zujalls- 
größe. 
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Die Funktion 
Fi drin <} 
ist die n-dimensionale Verteilungsfunktion des Zufallsvektors (&, ... , En). 

Wir betrachten die Größen &,,..., &, als Koordinaten eines Punktes in einem 
n-dimensionalen euklidischen Raum. Die Lage des Punktes (£,,..., &,) hängt 
offensichtlich vom Zufall ab, und die Funktion F(&,,...,2,) gibt bei dieser 
Interpretation die Wahrscheinlichkeit dafür an, daß der Punkt (&,...,&,) 
in das Parallelepiped & <2,...,,<z, mit zu den Koordinatenachsen 


parallelen Kanten fällt. 
Mit Hilfe der Verteilungsfunktion kann man leicht die Wahrscheinlichkeit 


dafür berechnen, daß der Punkt (&,,...,&,) innerhalb des Parallelepipeds 
,<i<b G=EB.:.,,0 

liegt; a; und b; bezeichnen dabei beliebige Konstanten. Man rechnet leicht 

nach, daß 


P{a<si<b, a <E<b,-...,, <E<b} 
hl 2201 52.9 7 5,97 75 Z22E 
+1" Fa, @ ..., 4) (1) 


ist; mit P;;...; ist dabei der Wert der Funktion F(c,c,...,c,) an der 
Stelle =, 5 =4,...,0,= 4, bezeichnet, die übrigen c, sind gleich 
den b,. Den Beweis dieser Formel überlassen wir dem Leser. Wir bemerken, 
daß insbesondere F(z,,...s2%_1 4 00, Zp+1 » :-»%) die Wahrscheinlichkeit 
dafür angibt, daß folgendes System von Ungleichungen erfüllt ist: 


<< har nun os <<: 
Da nach dem erweiterten Additionsaxiom 
Pi <a... a1 < Ru: Sr < pr > - sau 


= Z Ps <m sa <a un s<h<s tl, Su<arn Ho n<} 


3=—o0 
== (955% 5 Lu; 0 ) 
ist, stellt F(z,..-,%4 1, # ©, 241»... ,%,) die Verteilungsfunktion der 


(n — 1)-dimensionalen Zufallsgröße (&, &» - - - » &.-1» +1» -- -,&,) dar. Wenn 
wir diesen Prozeß fortsetzen, können wir die k-dimensionalen Verteilungs- 
funktionen beliebiger Gruppen von k Größen &, ,&, >. ++» &, (h<h<..-.< 
< i,) nach der Formel 


Fa ls, %,) =P{&,<2,s-..- <<} = Flo Cg3...,%)> 
bestimmen; dabei ist ,=x, fürs=i,(l<r<k) und in allen anderen 
Fällen ist c,—= + 00. Insbesondere ist die Verteilungsfunktion der Zufalls- 
größe £, gleich Fila) = Fly pe.) 
wobei alle c; (i # k) gleich + oosind, aber c, = z; ist. 

10 Gnedenko 
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Ähnlich, wie man das Verhalten einer eindimensionalen Zufallsgröße auch 
noch auf andere Weise als nur durch die Verteilungsfunktion charakterisieren 
kann, lassen sich mehrdimensionale Zufallsgrößen etwa durch eine auf der Menge 
aller BoreLschen Mengen des n-dimensionalen Raumes definierte volladditive 
nichtnegative Mengenfunktion ®{E} definieren. Diese Funktion definieren 
wir als die Wahrscheinlichkeit dafür, daß der Punkt (&,...,&,) auf die 
Menge E fällt. Diese Methode, eine n-dimensionale Zufallsgröße zu charak- 
terisieren, muß man für die natürlichste und vom theoretischen Standpunkt 
für die erfolgreichste Methode halten. 


Wir betrachten einige Beispiele. 

Beispiel 1. Ein Zufallsvektor (&,,...,&,) heißt gleichmäßig verteilt im 
Parallelepiped  <&;<b,(1l<i<n), wenn die Wahrscheinlichkeit dafür, 
daß der Punkt (&,&,...,£&,) in irgendein im Innern des Parallelepipeds 
gelegenes Gebiet fällt, dem Volumen dieses Gebietes proportional ist, und die 
Wahrscheinlichkeit, daß der Punkt überhaupt in das Parallelepiped fällt, ein 
sicheres Ereignis ist. 

Die Verteilungsfunktion der gesuchten Größe hat die Gestalt 


0, wenn X; < a;, für irgendein i, 
N ee 
Fass: -:W)= IS. wobeig=z,wenıng <x;,<b,, 
und ,=b,wennz, >b,. 


Beispiel 2. Eine zweidimensionale Zufallsgröße (£,, &) heißt normal verteilt, 
wenn ihre Verteilungsfunktion gleich 


z Y 
Fa,y)=C f[ fer“» dudv 
io 0 
ist; Q(z, y) bezeichnet dabei eine positiv definite quadratische Form von 2 — a 
und y — b mit konstanten Zahlen a und b. 
Bekanntlich läßt sich jede positiv definite quadratische Form von z—a 
und y— bin der Gestalt 


_k-ar k@—-d)Ww—b) (y—b)* 
Q@, y) = 2 4° T AB + 2 B: 


schreiben; A und B sind dabei positive, r, a und 5 beliebige feste reelle Zahlen, 
r ist nur der Bedingung — 1 <r< + 1 unterworfen. 

Man sieht leicht, daß für r? #1 jede der Zufallsgrößen &, und &, dem ein- 
dimensionalen Normalgesetz unterworfen ist. Es ist nämlich 


Fa) =Pfa <a}= Fa, +o)=C [seen dr dy 


2 
Eu PER | == FEB 1 m. 1 
es za N Al; 5 re 
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Da 
1 [y—b z—.a]2 
jvel BE" Ch 2n 
ist, so ist r 
_ ea) gt 
Fa)= Beyer]: a nm (0) 
—nxo 


Die Konstante C läßt sich durch A, B und r ausdrücken. Diese Abhängigkeit 
läßt sich aus der Bedingung F(+ &©) = 1 ermitteln. Wir haben 
_ ea? _. oe 
I=Bcyr|: rn. Anope | rg, t4B0n 


Hieraus gewinnt man 


Ist 2? #1, so setzen wir 
A=ayl—r, B=oyl—r. 


In diesen neuen Bezeichnungen sieht das Normalgesetz dann folgendermaßen 
aus: | 


i - u SE | I u: eZzaw-b) , w—d* 
gl 
I 2, 293 10 REG SER . 94 59 3 Idray. 
2n0,09,yl—r? 


| 

—o©0 —0 | 

Die wahrscheinlichkeitstheoretische Bedeutung der in diese Formel eingehenden | 

Parameter wird im folgenden Kapitel erklärt. 

Für r? = 1 verliert die Gleichung (2) ihren Sinn. In diesem Fall sind &, und &, | 

linear miteinander verknüpft. | 
Ähnlich wie im eindimensionalen Falle kann man auch für mehrdimensionale 
Verteilungsfunktionen eine Reihe von Eigenschaften zusammenstellen. Wir 
formulieren sie lediglich und überlassen dem Leser die entsprechenden Beweise. 

Eine Verteilungsfunktion ist 


1. in bezug auf jedes ihrer Argumente eine monotone nichtabnehmende 
Funktion, 


2. bezüglich jedes Argument linksseitig stetig 
und genügt 3. den Beziehungen 
F(+ 00,+0%,...,+0)=1, 
lim F(z,%2,...,%,)=0 (I<k<n) 


Zr—o 

bei beliebigen Werten der übrigen Argumente. 
Im eindimensionalen Falle haben wir gesehen, daß die aufgezählten Eigen- 
schaften notwendig und hinreichend waren, damit die Funktion F(x) eine Ver- 


10* 
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teilungsfunktion einer Zufallsgröße war. Im mehrdimensionalen Falle sind 
diese Bedingungen nicht mehr hinreichend. Damit eine Funktion F(t,,2,,...,2n) 
eine Verteilungsfunktion ist, muß man den aufgezählten drei Bedingungen 
noch die folgende hinzufügen: 


4. Für beliebige a; und b,(i=1,2,...,n) ist der Ausdruck (1) nicht- 
negativ. 

Daß diese Bedingung nicht notwendig erfüllt zu sein braucht, auch wenn 
eine Funktion F(t,, ...,2,) die Eigenschaften 1—3 besitzt, zeigt das folgende 
Beispiel. Es sei 


Fa 0, wennz <0Oodere+y<1oder wenny<(, 
9 1 im übrigen Teil der Ebene. 
Diese Funktion genügt den Forderungen 1—3, jedoch ist 
1 1 1: 1 
F(, y-Flz)-Fg1)+ Fl 5)=—1 (3) 


die vierte Bedingung ist also nicht erfüllt. 
Die Funktion F(x, y) kann keine Verteilungsfunktion sein, denn auf Grund 
der Beziehung (1) ist der Ausdruck (3) gleich der Wahrscheinlichkeit dafür, 


daß der Punkt (&,, &) in das Rechteck 2 < & < 1 ‚„<&<1iallt. 


Wenn eine Funktion p(x,%%...,2%,) derart existiert, daß für beliebige 
Xp Tg :..,%. die Gleichung 


Fix, 05...) -f Se Spez... md... dada 


besteht, dann heißt diese Funktion die Wahrscheinlichkeitsdichte des Zufalls- 
vektors (&, &,...,£,). Man sieht leicht, daß die Wahrscheinlichkeitsdichte 
die folgenden Eigenschaften besitzt: 


1. Pay %y m) 0. 
2. Die Wahrscheinlichkeit dafür, daß der Punkt (£,, &» .. . , &,) in ein Gebiet G 


fällt, ist gleich 
SS Plan...) dm...dn. 


Ist die Funktion p(x,, 3, . . . ,.%,) insbesondere im Punkt (2, .... ,%,) stetig, 
so ist die Wahrscheinlichkeit dafür, daß der Punkt (&,&%»-..,&,) in das 
Parallelepiped , <&,. <<. +de,(kk=1,2,...,n) fällt bis auf unendlich 
kleine Größen höherer Ordnung durch 


N Pl» Zap +» +» %,) dx, dag... . dan 
gegeben. 


Beispiel 3. Als Beispiel einer n-dimensionalen Zufallsgröße, die eine Dichte 
besitzt, führen wir eine in einem n-dimensionalen Gebiet G gleichmäßig ver- 
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teilte Größe an. Bezeichnet V das n-dimensionale Volumen des Gebietes G, 
so ist die Dichte gleich 
0, Wenn (u, I ...,%)EG, 
Pl %a - - Zu) 41 
— , WENN (ty, I ...,%,)EG. 


Beispiel 4. Die Dichte für das zweidimensionale normale Verteilungs- 
gesetz ist durch die Formel 


1 e@-a!_,, L-aw—d) N 


1 2a—r)| 02 07 
U) ——t 1 
Plz 9) 2no,oyl—r! 
gegeben. 
Wir bemerken, daß die Dichte der Normalverteilung auf jeder Ellipse 
«—- a 0, &@—-a)y—b) (y—b) 939 
Er a Ju a ae u, a 


einen konstanten Wert annimmt; A bezeichnet dabei irgendeine Konstante. Die 
Ellipsen (4) heißen aus diesem Grunde die Ellipsen gleicher Wahrscheinlichkeit. 

Wir suchen nun die Wahrscheinlichkeit für das Auftreffen des Punktes 
(£,, &,) innerhalb der Ellipse (4). Nach der Definition der Dichte ist 


PQü) = J P@, y) dx dy, (6) 


dabei ist mit G(A) das durch die Ellipse (4) begrenzte Gebiet bezeichnet. Zur 
Berechnung des Integrals führen wir Polarkoordinaten ein: 


z—a=0c0s®, 


y—b=osin®. 
Das Integral (5) sieht dann folgendermaßen aus: 
2n AlsYI—r 
1 ge 
P() = — e ? ododQ, 


2r0,%,yl—r? 


dabei steht der Kürze halber s? für 
1 Fr: cos O sin © sin? =| 


= 


1—r?| od 0,0, o} 


Die Integration über o ergibt 
a 2r 


1—e 2a-r) do 
PÜ) = — ——— [| —- 
220,0,yjl—r? 8 
ö 


Die Integration über @ kann man nach den Regeln der Integration trigono- 
metrischer Funktionen ausführen: Dies ist jedoch gar nicht nötig, da sie durch 
wahrscheinlichkeitstheoretische Überlegungen von selbst mit erledigt wird. 
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Es ist nämlich 
2n 
1 do 
P oJ)=l=— 7 ___ 1, 
SE) 2n00,%,y1l—r? i s* 
ö 


Hieraus gewinnt man die Gleichung 


2n 


[?- 227,0%yl—r? 
ö 


und erhält schließlich 
Fi 
Pay=1—e U), 


Die Normalverteilung spielt in vielen Fragen der Anwendung eine außer- 
ordentliche große Rolle. Es zeigt sich, daß viele praktisch wichtige Zufalls- 
größen eine normale Verteilung aufweisen. So bewies z. B. die sehr große Er- 
fahrung des artilleristischen Schießens unter den verschiedensten Bedingungen, 
daß beim Schuß aus einer Kanone mit bestimmter Zieleinstellung die Streuung 
der Geschosse auf der Ebene dem Normalgesetz unterworfen ist. In Kapitel VIII 
werden wir sehen, daß sich diese „Universalität‘‘ des Normalgesetzes dadurch 
erklären läßt, daß jede Zufallsgröße, die sich als Summe einer sehr großen Anzahl 
unabhängiger Zufallsgrößen darstellen läßt, von denen jede auf die Summe 
nur einen unbedeutenden Einfluß hat, fast nach dem Normalgesetz verteilt ist. 

Der wichtigste Begriff der Wahrscheinlichkeitsrechnung — die Unabhängig- 
keit von Ereignissen — behält seine Bedeutung auch für die Zufallsgrößen. 
Entsprechend der Definition der Unabhängigkeit von Ereignissen wollen wir die 
Zufallsgrößen &, &, ... , &, unabhängig nennen, wenn für eine beliebige Gruppe 
rer <<» <iL,) dieser Größen die Gleichung 


Pa, <u.&,<n...6,<uny=Pla,<u}Pla,<au}.. Pf, <a} 

bei beliebigen z,, %,,.--; %;, und beliebigem, k (I <k<n) besteht. Ins- 

besondere muß für beliebige x,, 2... . ,%, die Gleichung 
Pa<a<a...<a}=Pla<z}Pla<u}..- Pi <a} 


oder, in Verteilungsfunktionen geschrieben, die Gleichung 


Fü % > 2) = Film) - Fol) . - - Fulzn) 


bestehen; dabei bezeichnet F',(x,) die Verteitungsfunktion der Größe &;. 


Man sieht leicht ein, daß auch die umgekehrte Aussage richtig aus: Wenn 
die Verteilungsfunktion F(x,2%...,%,) eines Systems von Zufallsgrößen 
En En...» &, die Gestalt 


Fü &g 2.32) = Fils) Fl) . . » Fran) 
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hat und die Funktionen F,(x;) den Beziehungen 
F{+0)=1 (k=1,2,...,n) 

genügen, so sind die Größen &, &»..-,&, unabhängig und die Funktionen 
F,(&), Flo), - . - , F)(&.) stellen ihre Verteilungsfunktionen dar. 

Den Nachweis der Richtigkeit dieser Aussage überlassen wir dem Leser. 

Wenn die unabhängigen Zufallsgrößen &,&,...,&, die Verteilungsdichten 
Pı(X), Pal®), - - - » Pn(&) besitzen, so besitzt die n-dimensionale Größe 
(& &9 - - - »%,) die Verteilungsdichte 

Pl&p Ip - +» &n) = Pr) Pelle) - - - Pn() - 


Beispiel 5. Wir betrachten eine n-dimensionale Zufallsgröße, deren Kom- 
ponenten &,, &,...,&, voneinander unabhängige, nach dem Normalgesetz 


2% (ea, 
1 2 
F x) = €e 3 dz 
0% 2n 
—» 


verteilte Zufallsgrößen sind. 
Die entsprechende Verteilungsfunktion ist 


MN 2. @—1a,)’ 
rn = 
— 7 
Fa) zu 5) = (27) Di] °?% de, 
K=i 
— oo 


die n-dimensionale Verteilungsdichte der Größe (£&,, &, . . : , &,) 


_. ı 5 
£ı (2 7) 2 zur Y‘ ni E77 
a I Deren . (6) 
Für n = 2 sieht diese Formel so aus: 
SR (n— 9) =. (2.— 03)" 
um=,—e 1 9 


270,0, 
Ein Vergleich dieser Funktion mit der Dichte des zweidimensionalen Normal- 
gesetzes (Beispiel 4) zeigt, daß für unabhängige Zufallsgrößen &, und & der 
Parameter r gleich 0 ist. 

Für n = 3 läßt sich die Formel (6) als Wahrscheinlichkeitsdichte der Ge- 
schwindigkeitskomponenten £|, &,, £&, eines Moleküls in bezug auf die Koordi- 
natenachsen deuten (MAxXweusche Verteilung), wenn man nur voraussetzt, daß 


2 2 
d==R=-=— 


ist, mit der Molekülmasse m und einer Konstanten h. 
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Mit unserem jetzigen Wissen über Verteilungsfunktionen können wir an die 
Lösung der folgenden Aufgabe herangehen: Zu bestimmen ist auf Grund der 
vorgelegten Verteilungsfunktion F(x,,X,...,2,) einer Gesamtheit von Zu- 


138 IV. Zufallsgrößen und Verteilungsfunktionen 


fallsgrößen &,, &,...,&, die Verteilungsfunktion ©(y,, Ya, - - : , y„) der Größen 
m hrlen Er - En) na = Taler En En > 

Die allgemeine Lösung dieser Aufgabe ist äußerst einfach, erfordert jedoch 
eine Erweiterung des Integralbegriffs. Um nicht in rein analytische Probleme ab- 
zuschweifen, beschränken wir unsere Betrachtungen auf die wichtigsten Spezial- 
fälle: auf die diskreten und die stetigen Zufallsgrößen. Im folgenden Para- 
graphen findet man die Definition und die Haupteigenschaften des STIELTJES- 
Integrals; dort werden wir dann die wichtigsten Resultate dieses Paragraphen 
in voller Allgemeinheit wiedergeben. 

Wir betrachten zunächst den Fall, daß der n-dimensionale Vektor (&,,..., &,) 
eine Wahrscheinlichkeitsdichte pf(t,, 2, ...,%,) besitzt. Aus dem früheren 
ersieht man, daß die gesuchte Verteilungsfunktion durch die Gleichung 


Ply Ya --- )=S-..[P@o2 “+, En) dt; day... dam 
bestimmt wird; das Integrationsgebiet D ist dabei durch die Ungleichungen 
(Fir) <H Del u.ncK 
festgelegt I a I<u ) 


Im Falle diskreter Zufallsgrößen läßt sich die Lösung mit Hilfe einer eben- 
falls über das Gebiet D erstreckten n-dimensionalen Summe angeben. 

Diese kurze Bemerkung über die Lösung unserer allgemeinen Aufgabe wenden 
wir nun auf einige wichtige Spezialfälle an. 

Die Verteilungsfunktion einer Summe. Gesucht sei die Verteilungs- 
funktion der Summe 

y=-ıhtbt +: 

wenn die Wahrscheinlichkeitsdichte p (&,, 23, . . . , 2„) des Vektors (&,, &» . . -, &,) 
bekannt ist. Die gesuchte Funktion ist gleich der Wahrscheinlichkeit dafür, 
daß der Punkt (&,,&,...,&,) in den Halbraum + &+:---+&,<y fällt, 


also ist 
D)=f[.-. [Pina Er din... di 
2, <V 


Den Falln = 2 wollen wir etwas näher untersuchen. Die obige Formel sieht 
in diesem Falle folgendermaßen aus: 


WS Sp mdndu- ff Hermdndn. @ 


a t+m< 
Wenn die Größen &, und &, unabhängig sind, ist p(x,, 2%,) = Pı(%,) Pa(x,) und 
die Gleichung (1) läßt sich in der folgenden Form schreiben: 


DU) = Se, Spike) Dil) dry = [ar ] pie) pie —a) de 


Y 
= [dz{f pa) pe — a) day} - @) 
Im allgemeinen Fall ergibt die Formel (1) 


90) = [inf pan—9d. 6) 
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Durch diese Gleichungen wird folgendes gezeigt: Wenn die mehrdimensionale 
Verteilung der Summanden eine Wahrscheinlichkeitsdichte besitzt, so gilt das 
gleiche auch von der Summe. Die Wahrscheinlichkeitsdichte der Summe läßt 
sich im Falle unabhängiger Summanden in der Form 


p(y) = [ Pı(2) px(y — 2) dz (4) 
schreiben. 


Wir betrachten nun einige Beispiele. 


Beispiel. &, und £, seien zwei unabhängige und im Intervall (a, b) gleich- 
mäßig verteilte Zufallsgrößen. Gesucht ist die Wahrscheinlichkeitsdichte der 
Summen =& + &. 

Die Wahrscheinlichkeitsdichten von £&, und &, sind gleich 


0, wennz<aodexr>b, 
Pi&) = Pa) = ı 
I 


a’ wenn a<xz<pb. 


Aus der Formel (4) finden wir 
b d 
1 
Pr) = | mie) nude =; | pw — 2) de. 
& @ 


Da füry<2a 


y—2<2a—2<a 
und für y>2b 


y—z>2b—z>b 
ist, können wir schließen, daß füry <2aundy>2b 
P.(y) = 0 


ist. Es sei nun 2a <y<<{2b. Der Integrand ist nur für solche Werte z von 
Null verschieden, die den Ungleichungen 


a<y—z<b 
oder, was dasselbe ist, den Ungleichungen 
y—b<z<y—a 


genügen. Day > 2aist, soisty—a> a. Offenbaristy—a<bfüry<a-+b. 
Folglich ist fir2a<y<sa-+b 
y—a 


En de _y—2a 
Di = | ar 


Genauso findet man fürra +5b<y< 2b 


db 
= dd _2b—y 
Prly) ale Ba 
yv—b 


Ka A 
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Fassen wir alle gewonnenen Resultate zusammen, so finden wir 


0 füry<2aundy>2b, 
De © 
„ f < b, 
EOS 1 ver ae 6) 


= Barby can. 
Die Funktion p,(y) heißt das Sımpsonsche Verleilungsgesetz. 

Die Rechnungen vereinfachen sich in dem betrachteten Beispiel erheblich, 
wenn man geometrische Überlegungen zu Hilfe nimmt. Wir stellen wie üblich 
&, und &, als rechtwinklige Koordinaten in der Ebene dar. Dann ist die Wahr- 
scheinlichkeit der Ungleichung &+&<y für 2a<y<a-+b gleich der 


&,+&,;"l  farbels2b) 


(2a<lsa*b} 
£, 
Abb. 15 


Wahrscheinlichkeit dafür, daß n in das doppelt schraffierte rechtwinklige 
Dreieck fällt (Abb. 15). Diese Wahrscheinlichkeit ist, wie man leicht nach- 
rechnet, gleich Fa) = y— 2a) 
" 2 (a — bie ' 


Für a+b<y<2b ist die Wahrscheinlichkeit der Ungleichung 4 + & <y 
gleich der Wahrscheinlichkeit, daß 7 = & + &, in die ganze gestrichelte Figur 
fällt. Diese Wahrscheinlichkeit ist gleich 


_ı__%b—y% 


Differentiation nach y ergibt die Formel (5). 
Im Zusammenhang mit diesem Beispiel ist die folgende Bemerkung recht 
interessant. 
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Allgemeine Fragen der Geometrie führten N. I. LoBATSCHEWSKI auf die 
folgende Aufgabe: Gegeben sei eine Gruppe von n unabhängigen Zufallsgrößen 
Es E35 &n (Beobachtungsfehler); gesucht ist die Wahrscheinlichkeitsver- 
teilung ihres arithmetischen Mittels. 

Er löste diese Aufgabe nur für den Fall, daß alle Fehler gleichmäßig im 
Intervall (—1, 1) verteilt sind. Dabei zeigte es sich, daß die Wahrscheinlich- 
keit dafür, daß der Fehler des arithmetischen Mittels in den Grenzen von 
— x bis x liegt, gleich 

P,&) =1— 1 Der 


2n—1 r!(n—r)! 


— NT 


ist; dieSumme wird dabei über alle ganzen rvonr=Obisr = = erstreckt. 


Beispiel 2. Eine zweidimensionale Zufallsgröße (£,, &,) seinach dem Normal- 
gesetz 
1 


EN an 
1 w—a®) «—a)y—b) , y—b 
x xp | | 2 ar 0,0, 7 o ) 


verteilt. Gesucht ist die Verteilungsfunktion der Summen = & + &. 
Nach der Formel (3) ist 


1 
een 
x (e-al5-r @— a) (y—z—b) n Ve lar 


2(1—rM)\ 08 010g o 


Bezeichnen wir der Kürze halber y—a—bmitv und z— a mit u, dann ist 
1 


Pa) Iraafı — rn 
x [p|- 1 (32,2 +7) au. 


2(1—r?) \03 010 o 
Ferner ist 
2 2 ! 
Won w— u) + (v — u)? pi +2r,%+ 3 gypf +r% 1 ” 
o} 010g 0 0}; 0,0% o 


a Yyi+2ro,0 +0 v® o,-+r0 a (1 (co, + r 05)? ) 
010g 9 Yo? + 270,0, +0 7 Ar2ran+% 


010g % Yo +2ro,0,+ 08 


Mit der Abkürzung 


is 1 ne _ 0) H+r% | 


BI BEE o-trO [ (1 —r?) 


A+2r0m +02’ 


0,0, O5 yR+2roo+ 0% 
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läßt sich daher der Ausdruck für p,(y) in die Gestalt 


Di 
Dar ur il e 
= exp ERITET] ur 
ur og ruerer eh A 
In +2r,%,+o0 
bringen. Da Vor 
» 
v=y—a—b und J: 2 ER 
ist, wird 
__ mr _ 
2. 
EN POEBSEEN: SERHEBEN: (ft2rante) 


Y2r(0i +2r0,0, + 05) 


Wenn insbesondere die Zufallsgrößen &, und &, unabhängig sind, ist r=0, 
und es gilt 
m), 

— 1 __, Ar, 
y2 nz (0? ++ 03) 

Damit haben wir folgendes Resultat gewonnen: Die Summe der Komponenten 
eines normal verleilten Zufallsvektors ist nach dem Normalgesetz verteilt. 

Interessant ist die Bemerkung, daß im Falle der Unabhängigkeit der Sum- 
manden auch die umgekehrte Aussage richtig ist (Satz von H. CrAam&r): 
Wenn die Summe zweier unabhängiger Zujallsgrößen nach dem Normalgeselz 
verteilt ist, so ist auch jeder Summand nach. dem Normalgesetz verteilt. Wir 
halten uns nicht bei dem Beweis dieses Satzes auf, da er kompliziertere mathe- 
matische Hilfsmittel erfordert. 


PD.) = 


Beispiel 3. Die y%-Verteilung. &,&,...,&£, seien unabhängige Zufalls- 
größen, die nach ein und demselben Normalgesetz mit den Parametern a 
und o verteilt seien. 

Die Verteilungsfunktion der Größe 


1 n 
= = PX (& — a)? 
heißt die x%Verteilung. 


Diese Verteilung spielt in verschiedenen Fragen der Statistik eine wichtige 
Rolle. 


Wir berechnen jetzt die Verteilungsfunktion der Größe £ = Ri; 

Sie wird sich als unabhängig von a und o erweisen. rn 

Offensichtlich ist für negative Werte des Arguments die Verteilungsfunktion 
Ö(y) der Größe £ gleich 0; für positive Werte von y ist die Funktion &(y) 
gleich der Wahrscheinlichkeit dafür, daß der Punkt (&,...,&,) in die Kugel 


n 
E(n— at = y%.n.o8 
ku 
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fällt. Es ist also 
n 
n—- yo 
20 = |- . =) e i=1 ° du, da,...da.. 


za} <yn 
Zur Berechnung dieses Integrals gehen wir zu Kugelkoordinaten über, d. h., 
wir führen die Substitution 
x = eo cos 9, cos ©... 008 9,1, 
2%, = 0 cos ©, cos 9,... sin 9,1» 


=esinO, 
durch. Nach dieser Substitution erhalten wir 
T TH ” 
1 Be 
dy)= |... e ?0o1D(9,... 0,1) do dO,_ı-..d® 
o-[ | a FertDo, »dede,_,...d@, 
n x 0 
= WE 
vn 


3 
F | 26, 9) 9,1... do, 
7 


hängt dabei nur von n ab. 
Diese Konstante läßt sich leicht berechnen, wenn man die Gleichung 


Eu 


role Toid= rl ) 2? 


heranzieht. 
Hieraus findet man 
vr , 
1 = 
0-3 [en ” do. 
re): 
Die Verteilungsdichte der Zufallsgröße £ ist für y > 0 gleich 


ny’ 


er (er IB I (6) 


er 


Y(y) = 
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Hieraus erhalten wir insbesondere für n = 1 eine gegenüber der normalen Aus- 
gangsverteilung verdoppelte Verteilungsdichte 


2 _” 
vu =)yz « ’ >09. 


Für n = 3 erhalten wir das bekannte Be Gesetz 
3% za 
yy) = 
Durch analoge Rechnungen wie eben oder direkt aus der Formel (6) kann man 


die Verteilungsdichte der Größe x? ableiten. Für x > 0 ist diese Dichte gleich 


Pr(z) = SEE (6°) 
Fr 


Die Zahl n nennt man den Parameter der y2-Verteilung. Die in der Praxis 
häufig benutzten mit 4? zusammenhängenden Verteilungen haben wir in der 
folgenden Tabelle zusammengestellt. 


Verteilungsdichte für 
z>0 
z 
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Beispiel 4. Die Verteilungsfunktion eines Quotienten. Die Ver- 
teilungsdichte der Größe (£&,n) sei gleich p(z, y). Gesucht ist die Verteilungs- 


funktion des Quotienten & = £ . 
Definitionsgemäß ist 
Fx&) = P Bi < a} 
Stellt man & und n als Koordinaten eines Punktes in der Ebene dar, so ist 
F,(z) gleich der Wahrscheinlichkeit dafür, daß der Punkt (&, 7) in das Gebiet 
fällt, dessen Punkte mit ihren Koordinaten der Ungleichung £ < Tr genügen. 
In Abb. 16 ist dieses Gebiet schraffiert. 


u 
ee ar 
— ———_—__ 
——; [— 
= 
En 
ze 
= 
077 
: E 
= 
— 
>= 
I $cx 
ie 
ee 
a z 
———— 
De 
EEE ZEIT 
Abb. 16 


Nach der allgemeinen Formel ist die gesuchte Wahrscheinlichkeit gleich 
© zz 0 © 
Fx@)=f Sf pw D)dydz + f f pQ,2) dy de. m 
0 —o an 2z 


Sind & und 7 unabhängig voneinander, und sind p,(x) und ps(x) ihre Verteilungs- 
dichten, so ergibt sich hieraus die Beziehung 


© 0 
Fa) = S Fi@ 2) pa(2) d2+ f [1 — Fılzz)] Pelz) dz. (7) 
Wenn wir (7) differenzieren, so finden wir 


© 0 
Px(&) = FR pP (22,2) u—f zp (2x, 2) dz. (8) 
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Sind insbesondere & und 7 unabhängig, erhalten wir 
Pxlx) = f z PılzX) px(z) de — -f z Pı(2%) Pa(z) dz. (8) 


Beispiel 5. Eine Zufallsgröße (£, 7) sei nach dem Normalgesetz 


EBEHE. 5 A Ed A 
220,%,yl—r? E P\ 2(1—r?) E Fa 


verteilt. Gesucht ist die Verteilungsfunktion des Quotienten £ = & : 
7 
Nach Formel (8) ergibt sich 


[} 0 
_ 1 ef, , __# [($e#—2roag2+0 
Pi) 270,0, YlL—r? J I \v| | ojol | ni 


2 a 
2 —2r,,2 +0 


1 fe za 
ne er a te. 
0 


Wir führen nun die Variablensubstitution 


Pl, y) = 


2 Oo Hd —2rozto 


7, 2(1— 2) co 


durch; dann nimmt p;(x) folgende Form an: 


010g PREEEER.. . % 2 Sans BEER fe“ ,,yYl—r 


and —2roy2 +0) re lr,ge+ ei) 


Pa) = 


Sind die Größen £ und 7 unabhängig, so ist insbesondere 


Pıla) = u 


arte) 
Die Verteilungsdichte der Größe heißt das Cauchvsche Gesetz. 
Beispiel 6. Die Srupentsche Verteilung. Gesucht ist die Verteilungs- 
funktion des Quotienten = x mit den unabhängigen Zufallsgrößen & und n; 


€ sei nach dem Normalgesetz 


- nz 
Pia) = V»= u 


undn = er (siehe Beispiel 3) nach dem Gesetz | 


pie) = AB ee =. 
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verteilt. Nach Formel (8°) ist 


x 


nzta' Pe | nz? 
o-[ me Ei ) e 2 d 
ze: 


oo 


n—ı _M ar 
-_ 1 - e 2‘ nzdz. 
FR 


ö 
Mit Hilfe der Substitution 
2 
u= " (+1) 


finden wir 


Die Wahrscheinlichkeitsverteilungsdichte 
A 
—Lu4m) ® 
rrG) 


trägt die Bezeichnung Stupentsches Gesetz!). 
Für n=1 geht das Srupentsche Gesetz in das CaucHvsche Gesetz über. 


n+1 


px) = 


Beispiel 7. Drehung der Koordinatenachsen. Gegeben sei die Ver- 
teilungsfunktion einer zweidimensionalen Zufallsgröße (£,n). Gesucht ist die 
Verteilungsfunktion der Größen 


®=&cosa+tnsina, "=—E£sina+ncosa. (9) 


Wir bezeichnen mit F(z, y) und (x, y) die Verteilungsfunktionen der Größen 
(&,n) und (#’,n’). Wenn wir (&,n) und (#,’) als rechtwinklige Koordinaten 
eines Punktes auf der Ebene darstellen, sehen wir sofort, daß man das Ko- 
ordinatensystem &’On’ aus dem System &0n durch eine Drehung des letzteren 


um den Winkel « erhalten kann. Wir beschränken uns auf den Fall 0 <a <Z 


und überlassen dem Leser die Ableitung analoger Formeln für die übrigen 
Werte von o. 

Die Koordinaten eines Punktes M seien im System £0n gleich x und y, im 
System &’On’ gleich x’ und y’. F(«, y) ist dann gleich der Wahrscheinlichkeit 
dafür, daß der Punkt (£,) in das Innere des von den Halbgeraden AM und 


1) STUDENT ist das Pseudonym des englischen Statistikers GossET, der als erster dieses 
Gesetz auf empirischem Wege fand. 


ll Gnedenko 
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BM begrenzten rechten Winkels fällt (Abb. 17); die Funktion ®(#’, y’) ist 
gleich der Wahrscheinlichkeit dafür, daß der Punkt (£, 7) in das Innere des von 
den Halbgeraden CM und DM begrenzten rechten Winkels fällt. Die Glei- 
chungen der Geraden CM und DM sind im Koordinatensystem &0n 
n=6@—Dtga+y 
und 
n=—-e—mMetga+y. 


Abb. 17 


Da (z, y) und (x’, y’) durch die Gleichungen 
X" =xrcosa+tysina, y=—zsina+]ycosa 


miteinander verknüpft sind, kann man diese Gleichungen auch so schreiben: 


cos a ’ 
x 
=— € ctg & + na . 
Nach dem Früheren ist 
Da, y)=Sf[p&n)dn de, 


das Integral wird über das Innere des Winkels CMD erstreckt. Man sieht leicht, 
daß 


„ewerk, PRalL 122 77 
De) S Pimdnd+f S Pl&n)dnde 
—-90 —o z _o 
ist. 
Wenn wir diese Gleichung nach x’ und nach y’ differenzieren, so finden wir 


’ s ed ? E 
a) a = Da, 9) 


= pl(x’ cosa — y’ sino,x sina + y’coso). (10) 
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Beispiel 8. Die zweidimensionale Zufallsgröße (&,n) sei nach dem Nor- 
malgesetz 


1 1 x? zy y?) 
u EEE 
Pa 9) | Te] 


verteilt. Gesucht ist die Verteilungsdichte der Zufallsgrößen 


E—=Ecosa+nsinao, "=—E£Esina+tpncosa. 
Nach Gleichung (10) ist 
a(c,y') = p(@’ cosa—y’sina, zsina+y’cosa) 


1 


 2aagfl—r 


pl lArt—2Bry Hy, 


dabei steht zur Abkürzung 


de cos? & PB sind _ sin?a 
= — er ner z 
ot 0,0 og 
g — 0% Ein sin? & — cos? & cos & sin & 
eu end Pc er en er rn 
o 010g os 
sin? & cos& sin&  cos?a 
C= r +2r —— = 
oc 0,0 of 


Aus dieser Formel schließen wir, daß eine Drehung der Koordinatenachsen eine 
normale Verteilung wieder in eine normale überführt. 
Ist der Winkel « so gewählt, daß 


2ro,0, 
t 2% —— ee N 3 
u 
ist, soist B= (0 und 
1 et _ 
re, y) = e Ur) 21-r), 


220,%,y1l—r? 


Diese Gleichung besagt, daß jede normalverteilte zweidimensionale Zufalls- 
größe durch eine Drehung des Koordinatensystems auf ein System zweier 
normalverteilter unabhängiger Zufallsgrößen zurückgeführt werden kann. 
Dieses Ergebnis läßt sich auch auf n-dimensionale Zufallsgrößen übertragen. 

Man kann noch einen schärferen Satz beweisen, der die normale Wahr- 
scheinlichkeitsverteilung erschöpfend charakterisiert. Auf der Ebene sei eine 
nichtausgeartete (d.h. nicht auf einer Geraden konzentrierte) Wahrschein- 
lichkeitsverteilung gegeben. Diese Wahrscheinlichkeitsverteilung ist dann und 
nur dann eine normale Wahrscheinlichkeitsverteilung, wenn man auf der 
Ebene zwei verschiedene Koordinatensysteme &,0&, znd n,On, so wählen kann, 
daß die Koordinaten &, und &, sowie 7, und n,, aufgefaßt als Zufallsgrößen 
mit der vorgegebenen Wahrscheinlichkeitsverteilung, unabhängig sind. 


11* 
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$ 25. Das Srıertses-Integral 


In den folgenden Kapiteln wird der Begriff des STIELTIES-Integrals wesent- 
lich benutzt. Um das Studium der folgenden Paragraphen zu erleichtern, geben 
wir die Definition und die Grundeigenschaften des STIELTJSES-Integrals an, 
ohne uns bei den Beweisen aufzuhalten. 

Gegeben sei eine im Intervall (a, 5) definierte Funktion f(x) und eine eben- 
falls dort definierte nichtäbnehmende Funktion F(x) von beschränkter Va- 
riation. Wir wollen noch genauer voraussetzen, daß die Funktion F(z) links- 
seitig stetig sei. Sind a und b endlich, so zerlegen wir das Intervall (a, 5) durch 
die Punkte a =, <uy <y<:.-<ax,=b in endlich viele Teilintervalle 
(2; %; +1) und bilden die Summe 


= IE) IF@) — Fl, 


z, ist dabei eine beliebige Zahl aus dem Intervall (z;_,,2,). Nun lassen wir 
die Anzahl der Unterteilungspunkte unbeschränkt wachsen und lassen gleich- 
zeitig die maximale Länge der Teilintervalle gegen Null gehen. Wenn dabei 
die obige Summe einem bestimmten Grenzwert 


J=lim F/@) [F@) — F&_ı)l () 


n>@i=l 


zustrebt, so heißt dieser das Stiertses-Integral der Funktion f(x) mit der 
integrierenden Funktion F(x), und man schreibt 


JI= 7 f(x) dF(a) . (@) 


Wenn das Integrationsintervall unendlich ist, so definiert man das un- 
eigentliche StreLtses-Integral wie üblich: Man betrachtet das Integral über 
ein beliebiges endliehes Intervall (a, b); die Größen a und b läßt man dann auf 
irgendeine Weise gegen —oo bzw. +00 streben. Wenn dabei der Grenzwert 


b 
lim f f&) dF(x) 
a —o3a 
existiert, so heißt dieser das Srıewrses-Integral der Funktion f(x) bezüglich 
der Funktion F(x) im Intervall (—o, +00), und man schreibt 


S i@) dF@). 

Ist die Funktion (x) stetig und beschränkt, so kann man beweisen, daß 
der Limes der Summe (1) sowohl im Falle endlicher als auch im Falle unend- 
licher Integrationsgrenzen existiert. 

In einigen Fällen existiert das StreLtses-Integral auch für unbeschränkte 
Funktionen f(x). Für die Wahrscheinlichkeitsrechnung ist die Betrachtung 
gerade dieser Integrale von besonderem Interesse (Erwartungswert, Dispersion, 
Momente usw.). 
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Wir bemerken, daß das Integral der Funktion f(x) dann und nur dann existiert, 
wenn mit derselben Belegungsfunktion F(x) das Integral von |f(x)| existiert. 

Für die Zwecke der Wahrscheinlichkeitsrechnung braucht man auch eine 
Erweiterung des STIELTIESschen Integralbegriffs auf den Fall, daß die Funk- 
tion f(x) endlich oder abzählbar viele Unstetigkeitsstellen besitzt. Man kann 
beweisen, daß jede beschränkte Funktion mit endlich oder abzählbar vielen 
Unstetigkeitsstellen, insbesondere jede Funktion von beschränkter Variation, 
bezüglich jeder Belegungsfunktion von beschränkter Variation integrierbar ist. 
Dabei muß man nur die Definition des SrreLtses-Integrals etwas ändern, 
man braucht nämlich bei der Bildung des Grenzwertes (1) nur solche Unter- 
teilungen des Integrationsintervalls zu betrachten, bei denen jede Unstetig- 
keitsstelle von f(x) in der Menge der Unterteilungspunkte bei fast jeder (d.h. 
höchstens mit Ausnahme von endlich vielen) Teilung vorkommt. 

Bei der Festlegung der Integrationsgrenzen muß man darauf achten, ob 
die beiden Grenzen des Integrationsintervalls mit in die Integration ein- 
bezogen werden oder nicht. Aus der Definition des STIELTJES-Integrals erhalten 
wir nämlich die folgende Gleichung (a— 0 besagt, daß a in das Integrations- 
intervall einbezogen wird, a + 0 soll andeuten, daß a ausgeschlossen wird) 


b n 
J fo dF(x) — Z I) [F@) — Fr) 
= a. Z1@) [F@) — Fe) WEN I&ı) [F@&) — F@o)] 


b 
er S ® dF(x) + /(a) [F(a + 0) — F(a)] . 


Ist also f({a)# 0 und besitzt die Funktion F(x) an der Stelle = a einen 
Sprung, so ist 


b 
Iro dF(x) — St® dF(x) = (a) [Fa +0) — F(a—0)]. 


Dieser Umstand weist darauf hin, daß das SrreLtses-Integral über ein auf 
einen Punkt reduziertes Intervall von Null verschieden sein kann. Wenn 
keine anderen Verabredungen getroffen werden, so soll im folgenden stets der 
rechte Endpunkt des Intervalls ausgeschlossen, der linke Endpunkt in das 
Integrationsintervall mit einbezogen werden. Es gilt nun die folgende Gleichung 


f FG) = F(b) — F(a). 
Nach Definition ist nämlich 
Sar@) = lim % [F@) — Fl_,)] = lim [F,) — Fe] = Fb) — Flo) 
& n>oi=1l n—@ 


[wir erinnern uns daran, daß F(x) definitionsgemäß linksseitig stetig ist und 
demnach F(b) = lim F(b — e) ist]. 
s>0 
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Ist insbesondere F(x) die Verteilungsfunktion einer Zufallsgröße £, so ist 
fare) = F(b)— F(a)=Pfa<?f<b}, 
ji dF(a) = F)=P{£<b}. 
F(x) besitze nun eine Ableitung p(x) und sei selbst das Integral dieser Ab- 


leitung. Dann gilt nach dem Mittelwertsatz für eine bestimmte Stelle x; aus 
(2;_1, %;) die Formel 


F(&) — F@;_)) = P@&) — %_)): 
Mit den so bestimmten 2, ergibt sich nun die Gleichung 


b n 
S I(&) dF(x) = m 2 fe) [F@) — F—)] 


eo 
hr z I&) P&) (&--%—1) = [ I@) p@) dr. 
>oi= @ 
Wir sehen, daß sich in diesem Falle das STIeLTs&s-Integral auf ein gewöhnliches 
Integral zurückführen läßt. 
Besitzt F(x) an der Stelle x = c einen Sprung, so erhalten wir für eine Zer- 
legung, bei der , <c<2,,, für einen gewissen Index k ist, die Beziehung 


b k 
J fa) dF@) = m. 2 I&) IF) — Fa; ı)] 


+ fo) [Fe +) — F@@y)] + lim E 1@) IF@) — Fe; 


n>oi=k+2 
- f BAT fi EI FRAFOTFD EIN: 


Wenn sich die Funktion F(x) insbesondere nur in den Punkten 6, Cy ... 3 (ns +» 
ändert, so ist 


J I(&) dF(«) = -& Kon) [Fln +0) — Fin — 0] , 


und das STIELTJES-Integral ist auf eine gewöhnliche Reihe zurückgeführt. 

Wir zählen nun die Haupteigenschaften des STIeLTses-Integrals auf, die 
wir im folgenden benötigen werden. Den Beweis kann der Leser durch Zurück- 
gehen auf die Definition des Srıeurses-Integrals leicht selbst durchführen, 
wenn er daneben noch die in der Theorie des gewöhnlichen Integrals benutzten 
Gedankengänge anwendet. 


1.Fra<a,<og<:...-<c„<bist 


b n & 
Star =-E Joan  Ta=in bean: 


Übungen 153 


2. Ein konstanter Faktor kann vor das Integralzeichen gezogen werden: 
b d 
Se fx) dF(&) = c [ f(x) dF(e) . 


3. Das Integral einer Summe von Funktionen ist gleich der Summe der 
Integrale ihrer Summanden: 


j & h&) dF(e) = £ J h@) dF@) . 


si=1 


4. Ist f(x) > 0, F(x) eine nichtabnehmende Funktion und 5 > a, so ist 
b 
Sf@) dF@) >20. 
[3 


5. Sind F,(x) und F,(x) monotone Funktionen mit beschränkter Variation 
und sind c, und c, beliebige Konstanten, so gilt die Gleichung 


b 
He) de, File) + Fo) = 6 [Io dFs@) + I) Are). 


6. Ist (bei konstantem c) F(x) = f g(u) dG(u) mit einer stetigen Funktion g(u) 
ce 
und einer nichtabnehmenden Funktion G(u) von beschränkter Variation, so ist 
b b 
S H&) dF(x) = [ Io) g(a) dGl) . 
a “ 
Mit Hilfe des Begriffes des StreLtses-Integrals sind die allgemeinen For- 


meln für die Verteilungsfunktion der Summe zweier unabhängiger Summanden 


und (unter der Voraussetzung P {£, = 0} = 0) des Quotienten & zweier un- 
abhängiger Zufallsgrößen &, und &, durch Sr 


F(@) = [ F,(@— 2) dFy(z) = [ Fy(@ — 2) dF;() 


bzw. 
© 0 
F(a) = J F(@2) dFx(z) + [ [1 — Fı@@2)] dFxe) 
—o 
gegeben. 
Übungen 
1. Man beweise: Ist F(x) eine Verteilungsfunktion, so sind bei beliebigem k #0 die 
Funktionen 
De i z+h 
P(x) = T j F(z) dz und Y(x) = 37 j F(z) de 
z z—h 


ebenfalls Verteilungsfunktionen. 
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10. 


. Eine Zufallsgröße & besitze die Verteilungsfunktion F(x) [p(r) sei ihre Verteilungs- 


dichte]. Gesucht ist die Verteilungsfunktion (Verteilungsdichte) der Zufallsgrößen 
a)n=as-+b, a, b reelle Zahlen; 


b)y=H (P{£=0}=0); 
o)n=tgi; 
d)n=cosd; 


e) n=fl&);f{£) sei dabei eine stetige monotone Funktion ohne Konstanzintervalle. 


. Vom Punkte (0, a) sei eine Gerade unter dem Winkel p gegen die y-Achse gezogen. 


Gesucht ist die Verteilungsfunktion der Abszisse des Schnittpunkts dieser Geraden 
mit der x-Achse, wenn 


a) der Winkel im Intervall (% 3) gleichmäßig verteilt ist, 


b) der Winkel p im Intervall = .- 5) gleichmäßig verteilt ist. 


. Auf einen Kreis mit dem Radius R, dessen Mittelpunkt mit dem Koordinatenursprung 


zusammenfällt, werde aufs Geratewohl ein Punkt geworfen [mit anderen Worten, der 
Polarwinkel des Treffpunkts sei im Intervall (—r,r) gleichmäßig verteilt]. Gesucht 
ist die Verteilungsdichte 

a) der Abszisse des Treffpunkts; 

b) der Länge der Sehne, die den Treffpunkt mit dem Punkt (— R, 0) verbindet. 


. Auf das Intervall der Ordinatenachse zwischen den Punkten (0, 0) und (0, R) wird 


aufs Geratewohl ein Punkt geworfen [d. h. die Ordinate dieses Punktes sei im Inter- 
vall (0, R) gleichmäßig verteilt]. Durch den Treffpunkt werde die zur y-Achse senk- 
rechte Sehne zum Kreis x? + y? = R? gezogen. Gesucht ist die Verteilung der Länge 
dieser Sehne. 


. Der Durchmesser eines Kreises werde angenähert gemessen. Unter der Annahme, 


daß die gemessenen Werte gleichmäßig im Intervall (a, b) verteilt seien, bestimme 
man die Verteilung der Werte der Kreisfläche. 


. Die Verteilungsdichte einer Zufallsgröße £ sei durch die Gleichung 


(a) = — 
p e2 + e7 
gegeben. Man bestimme 
a) die Konstante a; 
b) die Wahrscheinlichkeit dafür, daß in zwei unabhängigen Versuchen £ Werte unter- 
halb von 1 annimmt. 


. Die Verteilungsfunktion eines Zufallsvektors (£,n) habe die Gestalt 


a) F(a,y) = Filz) - Fly) + Flz) ; 

b) F(z,y) = Filz) - Faly) + Falz) + Fiy). 

Können die Funktionen F,(x) und F,(xz) ganz beliebig gewählt werden? Sind dıe 
Komponenten £ und n unabhängig oder nicht ? 


. Auf das Intervall (0, a) werden auf gut Glück zwei Punkte geworfen [d.h. ihre Ab- 


szissen seien im Intervall (0,«a) gleichmäßig verteilt]. Gesucht ist die Verteilungs- 
funktion des Abstandes der beiden Punkte. 


Auf das Intervall (0,a) werden » Punkte geworfen. Unter der Annahme, daß die 

Punkte zufällig geworfen werden [d. h. ‚daß jeder von ihnen von den übrigen Punkten 

unabhängig sei und im Intervall (0, @) gleichmäßig verteilt sei], suche man 

a) die Verteilungsdichte des k-ten Punktes von links; 

b) die gemeinsame Verteilungsdichte des k-ten und des m-ten Punktes von links 
(k < m). 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 
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An einer Zufallsgröße & mit einer stetigen Verteilungsfunktion werden n unabhängige 
Versuche ausgeführt, die Versuchsergebnisse seien die Werte x,,2,...,2n. Gesucht 
ist die Verteilungsfunktion der Zufallsgrößen 


c) des der Größe nach k-ten Versuchsergebnisses. 
d) Man bestimme die gemeinsame Verteilung des der Größe nach k-ten und m-ten 
Versuchsergebnisses. 
Die Verteilungsfunktion der Zufallsvektors (&,&3...,&) sei Plz, 29... ,%n). Bei 
einem Versuch mögen die Komponenten des Vektors die Werte (2) 23 ...,2,) an- 
nehmen. Gesucht ist die Verteilungsfunktion der Zufallsgrößen 
a) & = max (2,2% :.., 20)» 
b) n= min (2,2% ...,2n)- 
Eine Zufallsgröße £ besitze eine stetige Verteilungsfunktion F(x). Wie ist die Zufalls- 
größe n = F(£) verteilt? 
Die Zufallsgrößen £ und n seien unabhängig. Ihre Verteilungsdichten seien durch die 
Gleichungen 
Pez) = Plz) = 0 für z=<o0 
Pelz) = ch zero hr, Dulz) = gar er Pr für 2<>0 
gegeben. Gesucht sind 1. die Konstanten c, und c,, 2. die Verteilungsdichte der Summe 
&+n. 
Man bestimme die Verteilungsfunktion der Summe zweier unabhängigen Größen & und 
n, von denen die erste im Intervall (— h, k) gleichmäßig verteilt ist und die zweite 
F(x) als Verteilungsfunktion besitzt. 
Die Verteilungsdichte des Zufallsvektors (£, n, &) sei gleich 
6 


— für 2>0,y>0,2>0 
Elena « 
0 sonst. 
Man bestimme die Verteilung der Größe & +n-+£. 
Man bestimme die Verteilung der Summe zweier unabhängigen Zufallsgrößen £, und 
&,, deren Verteilungen durch die folgenden Bedingungen gegeben sind: 


a) Bitten, Fa) =1+lantge; 
2 rn 2 nz 
b) &, und £, sind gleichmäßig verteilt in den Intervallen (— 5, 1) bzw. (1,5); 


a 
== = — a. 
°) mil) = le) = —e 
Die Verteilungsdichten zweier unabhängiger Zufallsgrößen £ und n seien durch die 
Funktionen gegeben: 
_f 0 für <0; 
a) Pelz) = Pu(z) Aa für 2>0 (a>0); 


u 0 für 2<0, z>a; 
PX) = Pal) = 1 2 
= für 0O<xe <a. 


Man bestimme die Verteilungsdichte der Größe £ = En P 


n 
Man bestimme die Verteilungsfunktion des Produkts zweier unabhängigen Zufalls- 
größen £ und 7 mit Hilfe ihrer Verteilungsfunktionen F,(z) und F;(z).. 
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20. 


21. 


22. 


23. 


24. 


25. 


26. 


27. 


28. 


IV. Zufallsgrößen und Verteilungsfunktionen 


Die unabhängigen Zufallsgrößen £ und n seien im Intervall (— a, a) gleichmäßig ver- 
teilt. Man bestimme die Verteilungsfunktion ihres Produkts. 


Die Seiten &£ und n eines Dreicks stellen unabhängige Zufallsgrößen dar. Mit Hilfe 
ihrer Verteilungsfunktionen Fy(z) und F,(x) bestimme man die Verteilungsfunktion 
der dritten Seite, wenn der Winkel zwischen den beiden Seiten £ und ) den konstanten 
Wert & besitzt. 


Man beweise: Wenn die Größen & und unabhängig sind und ihre Verteilungsdichte 
durch die Formel 
0 für e<0, 
pie) == |» für2no 


gegeben ist, so sind auch die Größen &+n und * unabhängig. 
7 


Man beweise: Sind & und ) normal verteilt mit den Paramete ma, =, =0,,=1,=0 
und unabhängig, so sind die Größen 

t=#®+m und RE 2 
unabhängig. s 
Man beweise: Sind & und n unabhängig und nach dem x?-Gesetz verteilt mit den 
Parametern n bzw. m, so sind die Größen =&+nundö= B unabhängig. 


Die Zufallsgrößen &,,&,...,&, seien unabhängig, sie mögen alle die gleiche Ver- 
teilungsdichte besitzen: 

(«—a)! 
ee 20 


Pl) = —. 
o y2 nz 
Gesucht ist die gemeinsame Verteilungsdichte der Größen 
n m 
= Z&und&= Zärlm<n). 
k=1 k=1 


Man beweise, daß eine Verteilungsfunktion die folgenden Eigenschaften besitzt: 


oo oo 
Im» [ are) =0, lim » [are =0, 
zo 2 z>+0 % 
® E1 
x = 
lim x Lare)=0, lim « [are =0. 
> —00 2 z>—0 2 
oo —o 


An einer Zufallsgröße £, die eine stetige Verteilungsfunktion F(x) besitzt, werden 
zwei Serien unabhängiger Versuche ausgeführt; die Versuchsergebnisse seien (der 
Größe nach in jeder Serie angeordnet) 
u <<. <ury Yyı <Yy <t<yr- 

Wie groß ist die Wahrscheinlichkeit der Ungleichungen 

Ya<&m+1<Yu+lo 
wenn m und u vorgegebene Zahlen sind O <m <M,0<au<N)? 
Eine Zufallsgröße & besitze eine stetige Verteilungsfunktion F(x). Bei n unabhängigen 
Messungen nehme die Zufallsgröße & die Werte , <2z3<:-':<z, an (die wir der 
Größe nach geordnet haben). Man bestimme die Verteilungsdichte der Größe 

2 Pen — Fa) 
Fan) — Piz) " 


V. 


ZAHLENMÄSSIGE CHARAKTERISIERUNG 
DER ZUFALLSGRÖSSEN 


Im vorigen Kapitel sahen wir, daß die Verteilungsfunktion einer Zufalls- 
größe diese am vollständigsten charakterisiert. Die Verteilungsfunktion gibt 
nämlich gleichzeitig an, welche Werte die Zufallsgröße annehmen kann und 
mit welchen Wahrscheinlichkeiten sie dies tut. In einer Reihe von Fällen 
braucht man jedoch von einer Zufallsgröße nur sehr viel weniger zu wissen, 
gefordert wird nur eine summarische Vorstellung von dieser Größe. Für die 
Wahrscheinlichkeitsrechnung und ihre Anwendungen spielen gewisse konstante 
Zahlen eine große Rolle, die man nach bestimmten Regeln aus den Verteilungs- 
funktionen der Zufallsgrößen erhält. Unter diesen Konstanten, die zu einer 
allgemeinen quantitativen Charakterisierung der Zufallsgröße dienen, sind die 
mathematische Erwartung, die Dispersion und die Momente der verschiedenen 
Ordnungen von besonderer Wichtigkeit. 


& 26. Die mathematische Erwartung 


Wir beginnen mit der Betrachtung des folgenden schematischen Beispiels: 
Wir nehmen an, daß man beim Schießen aus einem Geschütz zur Zerstörung 
eines Zieles mit der Wahrscheinlichkeit p, ein Geschoß, mit der Wahrschein- 
lichkeit p, zwei Geschosse, mit der Wahrscheinlichkeit p, drei Geschosse 
usw. benötigt. Außerdem sei bekannt, daß n Geschosse zur Zerstörung dieses 
Zieles sicher ausreichen. Es sei also 

Pr tPr+t'+m=1. 
Gefragt ist nach der Anzahl der Geschosse, die im Mittel zur Zerstörung des 
erwähnten Zieles erforderlich sind. 

Um auf diese Frage antworten zu können, gehen wir folgendermaßen vor. 
Wir nehmen an, es sei eine sehr große Anzahl von Schießversuchen unter den 
oben angegebenen Bedingungen ausgeführt worden. Dann können wir auf 
Grund des Berxovruiıschen Satzes behaupten, daß die relative Häufigkeit der 
Schießversuche, bei denen zur Zerstörung des Zieles nur ein Geschoß not- 
wendig war, ungefähr gleich p, ist. Genauso braucht man zwei Geschosse bei 
ungefähr 100 p; % der Schießversuche usw. „Im Mittel‘ braucht man also 
zur Zerstörung des Zieles ungefähr 


1-p +2-R+'--+n-m 
Geschosse. 
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Analoge Aufgaben der Berechnung des Mittelwertes einer Zufallsgröße er- 
geben sich bei den vielfältigsten Problemen. Daher führt man in der Wahr- 
scheinlichkeitsrechnung eine besondere Konstante ein, die mathematische 
Erwartung. Wir definieren sie in Anlehnung an das soeben betrachtete Bei- 
spiel zunächst für diskrete Zufallsgrößen. 


Di re ea gain 
sollen die möglichen Werte einer diskreten Zufallsgröße bezeichnen. 


Di Pr: Dan: »» 
seien die ihnen uimpresheninen Wahrscheinlichkeiten. 


Wenn die Reihe & %, PD, absolut konvergiert, so heißt ihre Summe die 


mathematische Erwartung (Erwartungswert) der Zufallsgröße £ und wird mit M& 
bezeichnet.!) 

Für stetige Zufallsgrößen ergibt sich naturgemäß folgende Definition: Wenn 
eine Zufallsgröße stetig ist und wenn p(x) ihre Verteilungsdichte darstellt, so 
bezeichnet man als den Erwartungswert der Größe &£ das Integral 


ME£E=f[zp(e) de, (1) 
Se] p@&) dx 
existiert. 


Ist & eine beliebige Zufallsgröße mit der Verteilungsfunktion F(x), so nennt 
man das Integral 


sobald nur ein Integral 


M&=fzdF@) @) 


den Erwartungswert von &. Unter Benutzung der Definition des STIELTJES- 
Integrals können wir den Begriff der mathematischen Erwartung leicht geo- 
metrisch deuten: Die mathematische Erwartung ist gleich der Differenz der 
Flächen, die einmal zwischen der Ordinatenachse, der Geraden y = 1 und der 
Kurve y = F(x) im Intervall (0, + 00) und zum anderen zwischen der Abszissen- 
achse, der Kurve y = F(x) und der Ordinatenachse im Intervall (— ©, 0) ein- 
geschlossen sind. In Abb. 18 sind die entsprechenden Flächen schraffiert, ferner 
ist angegeben, mit welchen Vorzeichen man in der Summe jede der Flächen 
zu versehen hat. Diese geometrische Veranschaulichung gestattet es nun, die 
mathematische Erwartung folgendermaßen zu schreiben: 


M£= = [F (x) dx + fü — F(e)) dr. (8) 


Mit Hilfe dieser Formel gelingt es in vielen Fällen, die mathematische Erwar- 
tung fast ohne Rechnung zu erhalten. So ist zum Beispiel für eine nach dem 
am Ende von $ 22 angegebenen Gesetz verteilte Zufallsgröße die mathematische 
Erwartung gleich 1/2. 


1) In der deutschen Literatur wird sie vielfach mit E(£) bezeichnet (Anm. d. Red.). 
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Wir bemerken, daß von den früher ‘betrachteten Zufallsgrößen die nach dem 
CaucHyschen Gesetz (Beispiel 5, $ 23) verteilten a ee keinen Erwar- 
tungswert besitzen. 


Abb. 18 


Wir betrachten nun einige Beispiele. 


Beispiel 1. Gesucht ist die mathematische Erwartung einer nach dem 
Normalgesetz 


P(&) = BL exp (- =) 
co y2 ne 20° 
verteilten Zufallsgröße £. 
Nach Formel (2) finden wir 


SE e ep (— Sr) de. 


auf die Gestalt 
zit 
Me. [e: +00 rn era [et 


e zt 
[« = TEE und [e« =(0 


ist, bekommen wir 
ME=a. 

Wir haben damit ein wichtiges Resultat gewonnen, das die wahrscheinlich- 
keitstheoretische Bedeutung eines der im Normalgesetz auftretenden Para- 
meter aufdeckt: Der Parameter a im normalen Verteilungsgesetz ist gleich der 
mathematischen Erwartung. 


Beispiel 2. Gesucht ist die mathematische Erwartung einer im Intervall 
(a, b) gleichmäßig verteilten Zufallsgröße £. 
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Wir finden 


Wir sehen, daß die mathematische Erwartung mit der Mitte des Intervalls 
der möglichen Werte der Zufallsgröße zusammenfällt. 


Beispiel 3. Gesucht ist die mathematische Erwartung einer nach dem 
Poıssoxschen Gesetz 
ak e—& 


Piel 
verteilten Zufallsgröße &. Wir erhalten 
M co k ak &—-% Sr akeze «5 ak—ı = ca co ak a 

e= 2 um un Au 


Zt 


k=0,1,2..) 


Ist F(x/B) die bedingte Verteilungsfunktion einer Zufallsgröße £, so heißt 

das Integral 

M(EIB) = [x dF (2/B) (4) 
die bedingte mathematische Erwartung der Zufallsgröße E bezüglich des Ereig- 
nisses B. 

B, Ba ..., Bu sei eine vollständige Gruppe unvereinbarer Ereignissse, 
F(z/B,). F(x/B,,...,F(x</B,) seien die diesen Ereignissen entsprechenden 
bedingten Verteilungsfunktionen der Größe &. Bezeichnen wir mit F(x) die 
unbedingte Verteilungsfunktion dieser Größe, so finden wir auf Grund der Formel 
der totalen Wahrscheinlichkeit den Ausdruck 

n 


Fü) = , P(B,) F@/B;). 


k= 
Diese Gleichung zusammen mit (4) führt uns auf die Formel 


ME -2 PB) M(@/B,) ; 


dies Jäßt sich offensichtlich auch noch anders schreiben: 
M£ = M{M (@/B))} : 6) 


Diese eben gefundene Formel vereinfacht in vielen Fällen wesentlich die 
Berechnung der mathematischen Erwartungen. 


Beispiel 4. Ein Arbeiter bedient rn gleichartige Maschinen, die geradlinig 
im gegenseitigen Abstand a angeordnet seien (Abb. 19). Wir nehmen an, daß 
der Arbeiter eine Maschine bedient, indem er an sie herantritt, wenn sie seine 
Aufmerksamkeit erfordert. Gesucht ist der mittlere Weg, die mathematische 
Erwartung der Weglänge zwischen den Maschinen. 

Wir numerieren die Maschinen von links nach rechts von 1 bis n und be- 
zeichnen mit B, das Ereignis, daß der Arbeiter sich bei der Maschine mit der 
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I 2 k n 
a 
I= (n-1)a 
Abb, 19 


Nummer k befindet. Da alle Werkbänke nach Voraussetzung von der gleichen 
Art sind, ist die Wahrscheinlichkeit p{® dafür, daß die nächste Maschine, 
welche die Aufmerksamkeit des Arbeiters erfordert, die Nummer i trägt, 


gleich n (1<i<sn). Die Weglänge ist in diesem Falle gleich 
2m (kk—D)a für k>i, 
((—kha für k<i. 
Nach Definition ist 
k n 
MalB) = (2 &da+ 2 Na) 
Nn \i=1 i=k+1 


a (k(k—]1) (rn —k)(n—k-+]1) 
u ur + ar) 


= BRr—2(n+lk+na+1)]. 


Die Wahrscheinlichkeit dafür, daß sich der Arbeiter an der k-ten Maschine 


befindet, ist gleich 3; auf Grund der Formel (5) finden wir daher den Aus- 
druck 


Mi= RR 2n+l)ktna+D]. 


£=1 
Bekanntlich ist e 
Dein anr N 
6 » 
also ist > w—n : a 
aln? — 
Mm z[l +). 


Dabei bezeichnet = (n — 1)a den Abstand zwischen den beiden äußersten 
Maschinen. 

Unter der mathematischen Erwartung einer n-dimensionalen Zufallsgröße 
(Eu & : . . ,&,) versteht man die Gesamtheit der n Integrale 


4=/Sf. -[mdF(&...,20::.,)=/[tdFia) = ME, 
F,(&) bezeichnet dabei die Verteilungsfunktion der Größe £;.!) 


1) Wir geben hier keine formale Definition des n-dimensionalen STIELTSES-Integrals an, 
einmal, weil wir praktisch nur diskrete und stetige Zufallsgrößen betrachten werden, und 
zum anderen, weil für die Wahrscheinlichkeitsrechnung im wesentlichen nicht die allgemeine 
Theorie der STIELTJES-Integrale, sondern die Theorie des abstrakten LEBESGUE-Integrals 
erforderlich ist (s. darüber genauer Kapitel 1 der Monographie von GNEDENKO und Komo- 
GOROFF, Grenzverteilungen von Summen unabhängiger Zufallsgrößen, 2. Aufl., Berlin 1960). 
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Beispiel 5. Die Verteilungsdichte einer zwei-dimensionalen Zufallsgröße 
(£,, &) sei durch die Formel 


m= = m 


1 
Pla) = UT 
_2r (a1 —a) eh EN =] 

0,09 0° 


gegeben (zwei-dimensionale Normalverteilung); man bestimme ihren Erwar- 
tungswert. 
Nach Definition ist 


a, = [fx pl. 2) dx, dx, = [ x, pılz,) dx, 


Q, = ff 2, P(&, 2) dx, da; = f 2, Pı(t,) day. 
Im Beispiel 2, $23, sahen wir, daß 


und 


Pı&) = 


1 |_&-= | 1 | (m or 
ep I— ; = exp I— 
SEE p| 30 Pa(%) FR P Er 
ist. Mit Hilfe der Ergebnisse des Beispiels 1 dieses Paragraphen erhalten wir 
daher 
Ü=0, BY=b. 
Damit können wir auch für die zwei-dimensionale Normalverteilung die wahr- 
scheinlichkeitstheoretische Bedeutung der Parameter a und b angeben. 


$ 27. Die Dispersion 


Als Dispersion einer Zufallsgröße & bezeichnet man die mathematische Er- 
wartung des Quadrats der Abweichung der Größe £ von M£. Die Dispersion 
wollen wir mit dem Symbol D £ bezeichnen. Nach Definition ist 


D£E= M&E— MB: [2 dF,(e) ; a) 


dabei ist mit F,(x) die Verteilungsfunktion der Zufallsgröße 7 = (£ — M£)? 
bezeichnet. 

Bei der praktischen Berechnung benutzt man häufig eine andere Formel, 
nämlich 


DE= [@— MöRdF.L). [9)) 


Die Äquivalenz der Formeln (1) und (2) ergibt sich unmittelbar aus dem 
folgenden allgemeinen Satz. 


Satz 1. Ist F,(x) die Verteilungsfunktion der Größe € und f(x) eine stetige 
Funktion, so ist 


Mf(&) = [ f&) dFa) . 


| 
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Beim Beweis dieses Satzes beschränken wir uns auf den Spezialfall, daß 


I&) = @— a) 


ist. Den vollständigen Beweis dieses Satzes bringen wir in $ 29. 
Wir setzen 


Ge) = P{e— at <a}; 
nach Definition ist dann 
ME — a = [2d6«) 
Ist k eine ungerade Zahl, so ist (£ — a)* eine nicht abnehmende Funktion 
von £, daher ist 
G@) = Pie — <a} =Ple—a< Ye) 
-Ple<a+ %l=Fla+ye). 
Für ungerades k ist also 
M(E — a)* = [zdF(a+Yr). 


Man rechnet leicht nach, daß durch die Substitution z=a+ Vz dieses Inte- 
gral in 


ME@— af = fi (z— a)! dF(z) 
übergeht. 


Ist k gerade, so ist (£— a)® eine nichtnegative Größe, folglich ist G(x) = 0 
für < 0. Für positive x ist 


Ga) = P{fE —af<a} = Pla— Yz LU + Vz] 
= Fla+jz)—Fla—je +0), 
folglich ist bei geraden k 
Me—a) = [zdFla +12) fzar(a— iz +0). 


k 
Durch die Substitutionen z=a-+ Vz im ersten Integral und z=a— Yz 
im zweiten bringen wir M(£ — a)* auf die Gestalt 


oo 
ME — at = [(e— a)" dF(e). 
—o» 
Für die Praxis erweist sich häufig eine andere Schreibweise der Formel (2) als 


zweckmäßig. 
12 Gnedenko 
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Da 
@— Mö?=2—2zME+(Md%® und M&=[zdF,() 
ist, läßt sich die Formel (2) in der Gestalt 


D£E= [ 2dFye) — ([ zdF.e)) = M&— (ME) (8) 


schreiben. 
Da die Dispersion eine nichtnegative Größe ist, schließen wir aus der letzten 
Beziehung auf die Ungleichung 


S#arye) > (f zdFya)*. 


Diese Ungleichung ist ein Spezialfall der Scuwarzschen Ungleichung. 

Ähnlich wie im Falle der mathematischen Erwartung besitzen nicht alle 
Zufallsgrößen eine Dispersion. So besitzt z. B. das früher betrachtete CaucHy- 
sche Gesetz (Beispiel 5, $ 24) keine endliche Dispersion. 

Nun sollen einige Beispiele für die Berechnung der Dispersion folgen. 


Beispiel 1. Gesucht ist die Dispersion einer im Intervall (a, b) gleichmäßig 
verteilten Zufallsgröße &. 
In unserem Beispiel ist 
b 


[* dryxa) = | „de — ” ae 
a 
Im vorigen Paragraphen fanden wir 
ME= @ .. b j 
Damit ergibt sich 
De "+ ar (ey ae 


Wir sehen, daß die Dispersion nur von der Länge des Intervalls (a, b) ab- 
hängt und eine mit der Länge zunehmende Funktion ist. Je größer das Inter- 
vall der von der Zufallsgröße angenommenen Werte ist, d. h., je weiter ihre 
Werte verstreut liegen, desto größer ist die Dispersion. Die Dispersion ist also 
ein Maß für die Streuung der Werte einer Zufallsgröße um ihre mathematische 
Erwartung. 


Beispiel 2. Gesucht ist die Dispersion einer nach dem Normalgesetz 


1 exp - (x | 
oyer Zei 


P@) = 


verteilten Zufallsgröße £&. 
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Es ist M&£ =, daher finden wir 


(«— a) 
DE = [ad pte)de = 2 [e-o. 30 de. 


for 


Unter dem Integralzeichen führen wir mit 


z—a 
== 


o 


eine Variablensubstitution durch; es ergibt sich 


ze 
DE= = ze *dz. 
2n - 


"= 


Durch partielle Integration finden wir 


Te ee 
[»: ?d=|—ze "+[e 2 d=y2n. 


—_o 


Damit ist also schließlich 
DE= 0%. 


Auf diese Weise haben wir auch die wahrscheinlichkeitstheoretische Bedeu- 
tung des zweiten im Normalgesetz auftretenden Parameters gefunden. Wir 
sehen, daß das normale Verteilungsgesetz vollständig durch die mathematische 
Erwartung und die Dispersion bestimmt ist. Dieser Umstand wird in den theo- 
retischen Untersuchungen weitgehend ausgenutzt. 

Wir bemerken, daß man im Falle einer normal verteilten Zufallsgröße aus 
der Dispersion auf die Streuung ihrer Werte schließen kann. Obwohl bei 
beliebigen positiven Werten der Dispersion die normal verteilten Zufallsgrößen 
alle reelle Werte annehmen können, ist jedoch die Streuung der Werte einer 
Zufallsgröße um so kleiner, je kleiner die Dispersion ist; es wird hierbei näm- 
lich die Wahrscheinlichkeit der nahe an der mathematischen Erwartung ge- 
tegenen Werte größer. Diesen Tatbestand hatten wir im vorigen Kapitel bei 
unserer ersten Bekanntschaft mit dem Normalgesetz bereits festgestellt. 


Beispiel 3. Gesucht ist die Dispersion der im Beispiel 4, $ 26, betrachteten 
Zufallsgröße A. 


Mit den Bezeichnungen des Beispiels 4 finden wir 


M(aR/B,) -4( Ek- par 5 (dh «) 
N \i=1 


i=k+1 


= [k—1)-k@k—1)+n—h) (n—k+1)@n—2k+1)] 


= [6R—6n+1)k+@n+Da+1)] 
12* 
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und damit 
May = I’ MdaryB) 
nel 
- Inn +1)@r+1)—3(n+1)?n+n(n+1)(2n-+1)] -Fm—ı) } 


Hieraus ergibt sich 
Dia) = Ma) — (Mi = m 1) HT 
6 9n® 
ee Fe 2.4 R 


Als Dispersion einer n-dimensionalen Zufallsgröße (&,, &, . . . , &.) bezeichnet 
man die Gesamtheit der n? durch die Formel 


bir = SS S (5; — ME) (u — ME) dFla, 2%...» 2) (4) 
(Isksn, I<sj<sn 


definierten Konstanten. Da bei beliebigen reellen ;(1<j<n) 
n 2 n N 
5 230 Ma} IF (& &. - > Zn) =2 z bu; > 0 
= z1ık=1 


ist, genügen — wie man aus der Theorie der quadratischen Formen weiß — 
die Größen b;, den Ungleichungen 


by bie’ dir 
Day Dan * - Dar >0 für k=1,2,...,n. 


Offenbar ist 


Die Größen b;, heißen für k # j die gemischten Zentralmomente zweiter Ord- 
nung der Größen £&; und £; ; offenbar ist b;, = bij: 

In der statistischen Literatur werden die b;, oft Kovarianzen von &, und & 
genannt und mit dem Symbol cov (£,, &;) bezeichnet. 

Die Funktion 


Tjj = u 
Vbrsd 
der Momente zweiter Ordnung heißt der Korrelationskoeffizient zwischen den 


Größen &; und &; . 
Der Wert des Korrelationskoeffizienten liegt zwischen den Grenzen (— 1, +1). 
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Da nämlich 


&i & 
Dr )= 2(1+4n)2>0 


ist, ergibt sich die Ungleichung 
—1 < Tij < 1; 


Die Werte + 1 werden nur in dem Falle angenommen, wo £&, und £; linear 
voneinander abhängen. Die Gleichung r;; = 1 ist nämlich dann und nur dann 


möglich, wenn 
D 4 = ..) =0 
Yes Ybn 


ist. Die Dispersion kann nur für solche Zufallsgrößen verschwinden, die mit 
der Wahrscheinlichkeit Eins irgendeinen konstanten Wert annehmen. Ist also 
rn;=1,somuß 


sein, und damit wird 
Er 
a=Vis+e (@=crbu). 
Ist andererseits ;; = — 1, so folgt genauso 
= — 2 &-+0. 
2] 


Wenn umgekehrt &=a$&;-+b, so folgt a= + Vs ; die eben durch- 
ii 


geführten Schlüsse lassen sich dann auch rückwärts verfolgen. 

Für unabhängige Zufallsgrößen £, und £, ist der Korrelationskoeffizient gleich 
Null. 

Der umgekehrte Schluß ist falsch. Der Korrelationskoeffizient zwischen den 
Größen & und n kann verschwinden, auch wenn diese Zufallsgrößen abhängig 
sind. Es sei z.B. = &? und & symmetrisch zum Punkt x = 0 verteilt mit end- 
lichem vierten Moment. 

Dann ist M&=0,M&n=M&=0 und folglich M(£ — M&) (n— Mn) 
=0,d.h.r,„=0. 


Beispiel 4. Gesucht ist die Dispersion der zweidimensionalen Zufallsgröße 
(&,, 3), die nach dem nicht ausgearteten Normalgesetz 
1 = 
270,0, yı — rn 


1 (z — a)? GZaW—d, BZ 
xp a Hong | 


P@&, y) = 


verteilt ist. 
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Nach Formel (4) und den Resultaten des Beispiels 2 dieses Paragraphen 
und des Beispiels 1 aus $ 25 finden wir 


Di, =a, Du, =. 
Ferner ist 


Ba = bu = | [| ed W—D) pie, u) dry 
W—b) 
£ 


|‘ 203 dy 


2rao,fl—r 
x [e-aW—Dep| tz —je. 


 2(1-P) 


Durch die Substitution 
SER 1 (=), PER uni. 
Y 1—r 9 0, 


geht der Ausdruck für b,, über in 


eo: 
bie = ba | [Aayi=rı: +ro0%2)e ? *dzd 
= 


e 5 Bann u 
„ua [pe ®di|e N Lie [te rat| ze 2d=rT0,%. 
2n 2n 


Hieraus finden wir die Beziehung 
_SSw-)y—brlsy)dedy _ MU&—ME) (is —Mödi 
1 0 yD & D & 
Der Parameter r ist also der Korrelationskoeffizient zwischen den Komponenten 
des Zufallsvektors (£&,, &) x 
Wir sehen, daß das zweidimensionale Normalgesetz ebenso wie das eindimen- 


sionale durch Vorgabe der mathematischen Erwartung und der Dispersion, d.h. 
durch Vorgabe der 5 Größen M&,M&,DE,D&£,r vollständig bestimmt ist. 


r 


$ 28. Sätze üher die mathematische Erwartung und die Dispersion 
Satz 1. Die mathematische Erwartung einer Konstanten ist gleich dieser Kon- 
stanten. 


Beweis. Eine Konstante C können wir als eine diskrete Zufallsgröße an- 
sehen, die nur den einen Wert C mit der Wahrscheinlichkeit 1 annehmen kann; 
daher ist 

MC=C:.1=C. 


Satz 2. Die mathematische Erwartung der Summe zweier Zufallsgrößen ist 
gleich der Summe ihrer mathematischen Erwartungen: 


M@+n)= ME+ Mn. 
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Beweis. Wir betrachten zunächst den Fall diskreter Zufallsgrößen & und n. 
QpAy...5,Q@n,... seien die möglichen Werte der Größe E und pP, Pa» ---> 
Pas - . - ihre Wahrscheinlichkeiten; b,, du, ..., dx, . . . seien die möglichen Werte 
der Größe n und 9, 9% -- -, 9x». . . die Wahrscheinlichkeiten dieser Werte. Die 
möglichen Werte der Größe £ + haben die Gestalt + b,(k,n=1,2,...). 
Wir bezeichnen mit p„; die Wahrscheinlichkeit dafür, daß & den Wert a, und 
n den Wert b, annimmt. Nach Definition der mathematischen Erwartung ist 


ME+n)= =; (On + 54) Pax = & „E.(0 + Bu) Par 
_ ulEm)+ 5 SR Fr.) 
n=1 k=1 k=1 n=1 
Nach dem Satz über die totale Wahrscheinlichkeit haben wir 


) © 
5 Pak = Pn und & Pnk = 93 
k=1 n=1 


folglich ist 
oo 
& 0, 2 Pur = 2 apa - M& 
n=1 k=1 
und 


Eh Emm= 2 hn- Mn. 


k=1 n=-1 


Der Beweis des Satzes ist damit für den Fall diskreter Summanden beendet. 
Ebenso finden wir in dem Falle, in welchem eine zweidimensionale Verteilungs- 
dichte p(z, y) des Zufallsvektors (£,, £,) existiert, auf Grund der Formel (3), $ 23: 


M£ = M& +9) = [2dF.(a) = [z(f pl, 2— 2) de) de 
= [fxzp(,2— 2) dzde = ff (e + y) plz, y) dz dy 
= ff z plz, y) dzdy + [[ y plz, y) dzdy 
= [zpele) de + [yp,(y)dy= M&E+ Mn. 


Folgerung 1. Die mathematische Erwartung der Summe endlich vieler Zu- 
fallsgrößen ist gleich der Summe ihrer mathematischen Erwartungen: 


Ma+&at++)=MA+M&E+ + ME. 
Auf Grund des eben bewiesenen Satzes ist nämlich 


M&H+&+t-- +&)= M&,+ M&+&+t: +8) 
=M3+ M&+Ml&+--+&) = =M&+ M&,+- +ME,. 
Folgerung 2. u sei eine Zufallsgröße, die nur ganzzahlige Werte annehmen 


kann. Die Zufallsgrößen &,&3.... mögen nicht von u abhängen, die mathe- 
matische Erwartung von u sei endlich, und die Reihe 


2 M&lP{a>k 
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konvergiere. Dann existiert die mathelhatische Erwartung der Summe 


„ehtrht + 
und ist gleich h 


M=2M&Pu>2j}. 


Beweis. Die bedingte mathematische Erwartung unter der Bedingung 
#=K ist gleich 


M{Llu=k}=M&A+M&H+-- + ME. 
Die unbedingte mathematische Erwartung ist gleich 


© © k 
M&,= 2 Mi lu=k}- Pa=kl= SPu=khE ME 
k=1 ko1 j-1 
= IMESPL=R=EMEPL>DT. 
j-1 k=j j-1 


Wenn die Summanden £,, &, & . . - gleichverteilt sind, d. h., wenn P{&,< x} 
=Pf,<z}=:.-.= F(a) ist, so ist 


M Eu = M & . M uk s 
denn es gilt die Beziehung 


Nu EZPR=-HZEME= MEZ - E— ME- Mo: 
= j- Land 


Beispiel 1. Die Anzahl der kosmischen Teilchen, die auf ein gegebenes 
Flächenstück fallen, ist eine Zufallsgröße z, die dem Poıssonschen Gesetz mit 
einem Parameter a unterworfen ist. Jedes der Teilchen trage eine vom Zufall 
abhängige Energie £&. Gesucht ist die mittlere Energie €, die das Flächenstück 
in der Zeiteinheit aufnimmt. 

Nach Folgerung 2 ist 

M&E=M£!:-Mu=aME. 


Beispiel 2. Auf irgendein Ziel wird solange geschossen, bis n Treffer er- 
zielt sind. Unter der Annahme, daß die Schüsse unabhängig voneinander aus- 
geführt werden und daß die Treffwahrscheinlichkeit bei jedem Schuß gleich p 
ist, bestimme man die mathematische Erwartung des Verbrauchs an Geschossen. 

Wir bezeichnen mit £, die Anzahl der Geschosse, die zwischen dem (k—1)-ten 
und k-ten Treffer verbraucht werden. Offenbar ist der Verbrauch von Ge- 
schossen bei n Treffern gleich 


Ee=-& ++. +: 
folglich ist 
ME=M&+ME&EH+---+ ME. 


M,=M&=:- :=ME, 


Nun ist aber 
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und 


M = 5 k 1 = PER. JR = 4 ’ 
Sı 2, a; 1—-M » 
folglich ist 


ME=-. 
p 

Satz 3. Die mathematische Erwartung des Produktes zweier unabhängigen 
Zufallsgrößen E und n ist gleich dem Produkt ihrer mathematischen Erwartungen. 

Beweis. & und n seien diskrete Zufallsgrößen, a, Ay ...,4g,... seien die 
möglichen Werte von & und P, Pa.» Px> -  - die Wahrscheinlichkeiten dieser 
Werte; by, da ..., dns... seien die möglichen Werte von 7 und 9, 9»: --> 
ns... deren Wahrscheinlichkeiten. Dann ist die Wahrscheinlichkeit dafür, 
daß & den Wert a, und n den Wert b, annimmt, gleich p; q„. Nach der Defi- 
nition der mathematischen Erwartung ist 


MEn=%345,mrm=L& %a,bn Pr In 
k,n kelne-l 


-(Zar)(Ze)- ME Mn. 
k=1 n=1 


Nur wenig komplizierter ist der Beweis für den Fall stetiger Größen. Seine 
Durchführung überlassen wir dem Leser. 
Den Beweis des Satzes im allgemeinen Fall führen wir in $29 durch. 


Folgerungi. Ein konstanter Faktor kann vor das Zeichen der mathematischen 
Erwartung gezogen werden: 


MCE=CME. 


Diese Aussage ist evident, denn wie auch immer £ aussehen mag, stets kann man 
die Konstante C und die Größe £ als unabhängige Größen ansehen. 


Satz 4. Die Dispersion einer Konstanten ist gleich Null. 
Beweis. Nach Satz 1 ist 
DC= MC— MC%= M(C—C’?=M0=0. 

Satz5. Istc eine Konstante, so ist 

Dc&=cDeE. 
Beweis. Auf Grund der Folgerung aus Satz 3 gilt 
De&= Mice&— Mc = M[e&—c ME]? 

= M&@[£E—MEP=a@M[E— MER=eDeE. 
Satz 6. Die Dispersion der Summe zweier unabhängigen Zufallsgrößen € und 
n ist gleich der Summe ihrer Dispersionen: 
D(e+M)=DE+Dn. 
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Beweis. Es ist nämlich 
Die +n) = M[E+n— M&@+ mM] = M[E—Md + (n— Mn)l® 
=DE+Dn7+2 ME — Md)(m— Mn). 


Die Größen € und n sind unabhängig, das gleiche trifft daher auch für die 
Größen &— ME undn— Mn zu; hieraus folgt 


M(&— M&d) (n— Mn) = M&E— Md:- Mn — Mn) =0. 


Folgerungl. Sind &,, &, . . . , &, Zufallsgrößen, von denen jede von der Summe 
der vorhergehenden unabhängig ist, so ist 


Da, +& +. -+)=Du+D&E +. +DE. 


Folgerung 2. Die Dispersion der Summe endlich vieler paarweise unabhän- 
gigen Zufallsgrößen &,, &g . - -, &, ist gleich der Summe ihrer Dispersionen. 


Beweis. Es ist doch 


n 2 
Desaster Mm E26 Mio) 
=ME E(&—MNM)&—Mi)=L& Z M&— ME)(&— ME) 
jelk-1 k=1j=-1 
= Sy D&+% M&— ME) (&;— ME}. 
k=1 k4j 
Aus der Unabhängigkeit eines beliebigen Paares der Größen &, und &; (k#J) 
ergibt sich für k#j 
M(&— M&)(&,;—M&)=0. 
Damit ist der Beweis offensichtlich beendet. 


Beispiel 3. Als normierte Abweichung einer Zufallsgröße bezeichnet man den 
Quotienten 


Wir wollen beweisen, daß 


yDE 
ist. &und M£ sind ja, als Zufallsgrößen betrachtet, unabhängig; daher gilt auf 
Grund der Sätze 5 und 6 die Beziehung 
D &—-M£\ _DE+DI-MS) _DE_ 5, 
yDe ) DE DE 


Beispiel 4. Sind £ und 7 unabhängige Zufallsgrößen, so gilt die Gleichung 
De—mM)=D£!+Dn. 
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Auf Grund der Sätze 6 und 7 ist nämlich D(—n) = (—1)?Dn und D(£E —n) 
=DE+Dn. 

Beispiel5. Mit Hilfe der Sätze 32 und 6 berechnet man nun sehr einfach die 
mathematische Erwartung und die Dispersion der Zahl », die angibt, wie oft ein 
Ereignis A in n unabhängigen Versuchen eintritt. 

Px sei dieWahrscheinlichkeit des Eintretens des Ereignisses A im k-ten Versuch. 
Wir bezeichnen mit w;, die Anzahl des Eintretens des Ereignisses A im k-ten Ver- 
such. z; ist offensichtlich eine Zufallsgröße, die die Werte 0 und 1 mit den 
entsprechenden Wahrscheinlichkeiten g, = 1 — p; und p, annimmt. 

Die Größe u läßt sich also in Form der Summe 


A=lntMat' TH 
darstellen. Da 
Mu=0:%+1'p=Pr 
und 
Du = Ma — (Ma =0-.4. +1’ R—pi=p(—Pp)=P% 
ist, so kann man auf Grund der bewiesenen Sätze auf die Gleichungen 
Ma=Pı+Pat''"+ Pa 
und 
Du=Pp9+:'-+ Pu 
schließen. Für das BERNoVLLIsche Schema ist p, = p und somit 
Ma=np und Da=npg. 
Wir bemerken, daß sich hieraus die Beziehungen 
n ’ n n 
ergeben. 

Beispiel 6. Wir suchen die mathematische Erwartung und die Dispersion 
der Anzahl des Eintretens des Ereignisses E bei Versuchen, die durch eine ho- 
mogene Markowsche Kette miteinander verknüpft sind (vgl. $ 20). 

Wie eben bezeichnen wir mit u; die Anzahl des Eintretens des Ereignisses E im 


k-ten Versuch. Die Anzahl des Eintretens dieses Ereignisses in rn Versuchen ist 
gleich der Summe 


B=ltMt' tim 
Es gilt n n 
Ma— 2 Muw=$%Ppr: 
k=1 k=1 
Nach Formel (1’), $ 20, ist 


R=Pp+m—pMH-. 
Daher gilt 
1— or 


Mu=np +2 MP) Penp+la—PT—z- 
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Nach Definition ist 
n a 
Da = Miu — Mu)? = M| 2 u 2) 


-2z Mu — Pr)? + 22 Mu; — Pi) (u; — P}) - 
= j>i 
Nun ist aber 


Du =Pr%=Ppq + (g—p) (pr — p) 68! — (p, — p)R 68k-2 , 
wo 
4 =1—- pr =9—- (pm — pP). 
Weiter ist 
Mu — pP) 4 —P)) = Mu m; — PıP;- 
Die Wahrscheinlichkeit für die Gleichung 4; za, = 1 ist offensichtlich gleich p; pP, 


und daher ist 
Mu: — P)) (4 —P)) = pi (PP —P)) - 
Indem wir die Formeln (1’) und (2’), $20, benutzen, finden wir 
M( — Pi) (u; — Pj) = pq 87° + (pr — pP) (1 — P) 7" — (pı — PR Ö+3=2. 
Es ist also 


‚Zn npı+ aan mE 


und 
EM —p) u —p) = npg 4 — pa, (14.28 
454 a 1-3 ge ee | 


Mn) ap) (6 0" _ (Mon MU) 18) 
na: = Zus (7 a mas: a 


Es gilt deshalb 


1+6ö 
Du=npg 54%. 


wo a, eine Größe ist, die bei wachsendem n beschränkt bleibt. 


$& 29. Definition des Erwartungswertes in der Konmocororrschen Axiomatik 


Dieser Paragraph kann beim ersten Durchlesen des Buches übergangen wer- | 
den, denn er stellt erhöhte Anforderungen an die Kenntnisse des Lesers auf dem 
Gebiet der Integrationstheorie. Die hier dargelegte allgemeine Auffassung ist 
eine naturgemäße Weiterentwicklung des von A. N. KoLmoGororrF geschaffenen 
Aufbaus der Begriffe zufälliges Ereignis, Wahrscheinlichkeit und Zufallsgröße 
(siehe die $$9 und 21). In dieser Auffassung reduziert sich der Begriff des 
Erwartungswertes naturgemäß auf ein abstraktes Leszssussches Integral. 

Der Erwartungswert einer Zufallsgröße E = f(e) ist definitionsgemäß das 
Integral 

ME= JS f(e) Pfde} . 
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Die bedingte mathematische Erwartung unter der Bedingung B ist gleich 
M{£|B} - [ie P{de|B}. 
Man beweist leicht, daß diese Definition der folgenden äquivalent ist 
M{g|B} = [ fe) Pfde}- I, 
{eIB} = S I) Plde}- 2, 


die häufig für die praktische Anwendung besser geeignet ist. 
Wenn ein Ereignis B sich als Vereinigung endlich oder abzählbar vieler 
disjunkter Ereignisse B, darstellen läßt, 


B=B+B+t---, 


Sie) P{de} = f ie) P{de} . 
B kB; 


Nützlich ist auch folgende Bemerkung: Während wir früher beim Beweis des 
Satzes über die mathematische Erwartung einer Summe ziemlich lange Über- 
legungen durchführen mußten, ist jetzt dieser Satz einfach eine Folgerung der 
Formel 


so ist 


S@# +9) P(de) = ff P(de) + Jg P(de). 
Für unabhängige Zufallsgrößen € und 7 bewiesen wir früher die Formel 
M&@-)=M&-Mn () 


nur für diskrete und stetige Zufallsgrößen. 
Im allgemeinen Falle führen wir zunächst diskrete Zufallsgrößen Z,, und 7 
durch die Formeln 


LM gu m m+1 
er für zarz a, 
u; a k k+l1 

Z für mei Pr 


ein. Dann ist 
M(&un* 9) =M &,: Mm - 

Nach den bekannten Sätzen über den Grenzübergang unter dem Integral- 

zeichen erhalten wir leicht die Beziehungen 
imM&,=M£E, limM„=Mn, lmM(&,:7)=M(-n) 

Damit ist die Formel (1) im allgemeinen Fall bewiesen. 

Alles dies wenden wir nun zur Ableitung einer Formel an, die ein Resultat des 
$ 28 (Folgerung 2 aus Satz 2) verallgemeinert. Diese Formel werden wir aus dem 
folgenden Satz gewinnen, der von A. N. KoLmocoroFr und J. W. PROCHOROW 
bewiesen wurde. j 

Gegeben sei eine Folge von Zufallsgrößen 

"IE FEERER FOL 


und 


Lsehtrkbt. th 
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bezeichne die Summe der » ersten Größen. Die Anzahl » der Summanden sei 
selbst eine Zufallsgröße. 
Wir bezeichnen mit S, das Ereignis » = m und setzen 


Pa=P {Su}: PR=Pp>nl= Em. 


Satz. Sind für n> m die Zufallsgröße €, und das Ereignis S, unabhängig, 
existieren ferner die Erwartungswerte 


„= M En 
(und sind infolgedessen die Größen „= M |£,„| endlich), und konvergiert schließ- 
lich die Reihe 
oo 
Zap 
n=1 
so existiert der Erwartungswert der Größe, und ist gleich 


M&L,=2%pA 
n=1 
wobei 


ee =ML.=4+%+::+@ 
gesetzt ist. 


Beweis. Auf Grund unserer Voraussetzung ist 
oo oo 

ZPnAn=% Pu. 
n=1 n=1 


Da £, nicht von dem Ereignis {» < n} abhängt, hängt es auch nicht von dem 
entgegengesetzten Ereignis {y > n} ab, daher ist 


„=M4,=M{ubZn}. 


Beachtet man diese Gleichungen sowie die früher angeführten Eigenschaften der 
bedingten mathematischen Erwartungen, so können wir folgende Gleichungs- 
kette schreiben; 


Em EPb>nMEbrDn=Z SEP) 
an=1 n=l nulfr>n 
-L 2 S&Pld). 


n=lm=n{r=m} 
Da aber die Größe |£,| und das Ereignis (v > n) ebenfalls unabhängig vonein- 
ander FEN so ist 


[Ei ‚rols, < zZ E [11 Plde) 


Ri Bi {= m} 


= 5 ı ‚Kal P {de} = Z Pf >n} M{l&l» >n} 


u 


= SPp>n}MA|l= I Pa<+o. 
n=1 n=1 
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Die eben durchgeführte Abschätzung gestattet es, die Gleichung 


B5 > [Pie = 3 B3 SE P@o—E g5 Pa) 


n=1 mens, 


aufzuschreiben. Da 
ML, = S L, P(de) = zZ J Cm P(de) 


ist, beweist die vorige Gleichung unseren Satz. 


Folgerung. Ist unter den Bedingungen des eben bewiesenen Salzes a= a, = 
G=+...,50 ist © 
Mi{L,=aM»=aynp,- 


n=1 


& 30. Momente 


Als Moment k-ter Ordnung einer Zufallsgröße & bezeichnet man den Erwar- 
tungswert der Größe (& — a)*: 


va) = ME — a). () 


Für a = 0 heißt dieses Moment das Anfangsmoment. Man sieht leicht, daß 
das Anfangsmoment erster Ordnung der Erwartungswert der Größe £ ist. 

Ista= ME, so heißt dieses Moment das Zentralmoment. Man sieht leicht, daß 
das Zentralmoment erster Ordnung gleich 0, das Zentralmoment zweiter Ord- 
nung aber nichts anderes als die Dispersion ist. _ 

Die Anfangsmomente wollen wir mit »,, die Zentralmomente mit A bezeich- 
nen; in beiden Fällen gibt der Index die Ordnung des Moments an. 

Zwischen den Zentralmomenten und den Anfangsmomenten besteht ein 
einfacher Zusammenhang. Es ist nämlich 


In = ME— MO = Z Ck(— MOr—TME = ZA-MYn. @) 
k=0 k= 
Dar», = ME£ ist, so haben wir die Beziehung 
mE rn a Dot. (8) 


Diesen Zusammenhang zwischen den Momenten wollen wir für die ersten 
vier Werte von n aufschreiben: 


W=l, 
Mm=b, 
kB=n—N; (3) 


B=n—3n N +2N, 
Key —Inn +6 —3n. 


Diese ersten Momente spielen in der Statistik eine besonders wichtige Rolle. 
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Die Größe my M le se alt (4) 


heißt das absolute Moment k-ter Ordnung. 


Nach Satz 1, $ 27, ist 
v.(a) = [ (ce — a)* dF(a). (5) 
Wir hatten oben verabredet, daß eine Zufallsgröße £ nur dann eine mathe- 
matische Erwartung besitzt, wenn das auftretende Integral absolut konvergiert. 


Es ist daher klar, daß das Moment k-ter Ordnung einer Zufallsgröße & dann und 
nur dann existiert, wenn das Integral 


SleF ar, @) 
konvergiert. Wenn also eine Zufallsgröße £ ein Moment k-ter Ordnung besitzt, 
so folgt aus dieser Bemerkung, daß sie auch die Momente aller positiven Ord- | 
nungen kleiner als k besitzt. Da nämlich für r < k und |x| > 1 stets |c]* > [x] 
ist, erhalten wir die Beziehung 


Slelr dr) = : er arza) + d „leir dFx(z) 
< [ klar + f[ eltdr,(e). 
eisı le|>ı 


Das erste Integral auf der rechten Seite der Ungleichung ist wegen der end- 
lichen Integrationsgrenzen und der Beschränktheit des Integranden endlich. 
Das zweite Integral konvergiert nach Voraussetzung. 

Beispiel. Man bestimme die Zentralmomente und die absoluten Zentral- 
momente einer nach dem a 


in a er | 


verteilten Zufallsgröße. 


Wir erhalten 
2 
= ee ep |— er - [re te. 
7 
Da bei en k der Integrand eine ungerade Funktion ist, ergibt sich 


Kk=0. 


2 ra -£ 
mem Vie | zke : de. 
0 
Durch die Substitution 2? = 2 z bringen wir dieses Integral auf die Gestalt 


8-1 f ko —1 
nm -VYoaT 2 jF 3 erde=V2o2 » re) 
kt 


Bei geraden k ist 


=k—1)(k—3)...1= 


D 
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Bei ungeraden k ist das absolute Moment gleich 


Die Momente der Verteilungsfunktionen können nicht willkürliche Größen 
sein, denn bei beliebigen Konstanten 1, &, . - ., Z, ist die quadratische Form 


n 2 nn 
1.= |(Z,me-ar) are) = & Enann20 
k=0 j=0k-=0 


stets nichtnegativ; daher müssen die ersten »; (a) den folgenden Ungleichungen 
genügen: 


voaa) vl) ... la) 
(a) vıld) ... 9441(@) >0 (k = 0,1,2,...,n). 
vx(a) 94410) - - - Var(a) 


Analogen Ungleichungen sind auch die absoluten Momente unterworfen. 
Über die absoluten Momente beweisen wir noch den folgenden Satz. 


Satz. Wenn eine Zufallsgröße € ein absolutes Moment der Ordnung k besitzt, 
so is! mit 
m = Ml&—.al 
für beliebige tund«(O<t<r<k) 
Ym, < m, < m; 
(a sei eine beliebige reelle Zahl). 


Beweis. Wir beweisen den Satz zunächst für den Fall, daß £, r und k rationale 
Zahlen sind. Es sei also 


p 8 w 
t =, =—, k = —, 
q . q q 
auf Grund der Voraussetzungen unseres Satzes,ist dabei 
p<s<w. 


Sei nun rirgendeine ganze positive Zahl kleiner als w. Wir betrachten die nicht- 
negative quadratische Form 


ua +17 
Mr U? +2mr UV + Mr+ı DR = [[ut2-« ?ı vu |e—al% | dF(x). 
q q q 
Als Bedingung dafür, daß sie nichtnegativ ist, hat man bekanntlich die 
Ungleichung 

m, <M_ı* Merı: 

q q q 

13  Gnedenko 
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Diese läßt sich offenbar auch folgendermaßen schreiben: 
my < m My: 
r q q 
Gibt man r nacheinander die Werte von 1 bis r, so erhält man eine Folge von 
Ungleichungen 


PJREE raue Soc SR ver Er mE Se Ze | 


Wir bemerken, daß stets 
m=1 
gilt; wenn wir nun die aufgestellten Ungleichungen miteinander multiplizieren, 
so erhalten wir nach einigem Kürzen die Ungleichung 
miH<m,,. 


5 q q 
Es ist also 
3 a 
r r+1 
m, S Mrzı 
q q 
oder auch 
4 Me 
r ‚+1 
m; < m} 
q q 


Diese Ungleichung beweist offenbar den Satz im Falle rationaler f, und k. 

Da die Funktion m, bezüglich des Arguments t im Bereich 0 <!<k stetig 
ist, überzeugt man sich durch Grenzübergang leicht von der Richtigkeit des 
Satzes für beliebige i, r und k. 

Wir bemerken noch, daß in dem eben bewiesenen Satz folgende wichtige 
Eigenschaft der Momente mit enthalten ist: 


ı 1 1 1 
2 ST {} k+1 
m sm sm <.. Sm SmaS 


In den Beispielen der früheren Paragraphen bestimmten die beiden ersten 
Momente einer Zufallsgröße vollständig ihre Verteilungsfunktion, wenn nur 
vorher die Form dieser Funktion bekannt war (so verhielt es sich im Falle der 
normalen, der Poıssoxschen und der gleichmäßigen Verteilung). In der mathe- 
matischen Statistik spielen jedoch auch Verteilungsgesetze eine wesentlicheRolle, 
die von mehr als zwei Parametern abhängen. Wenn man von vornherein weiß, 
daß eine Zufallsgröße einem Gesetz ganz bestimmter Form unterworfen ist, und 
nur die Werte der Parameter noch unbekannt sind, so lassen sich diese unbekann- 
ten Parameter in den wichtigsten Fällen durch die ersten Momente bestimmen. 
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Wenn man jedoch nicht weiß, zu welchem Typus die Verteilungsfunktion gehört, 
so gibt nicht nur die Kenntnis der ersten Momente, sondern sogar die Kenntnis 
aller ganzzahligen Momente im allgemeinen keine Möglichkeit, diese Funktion 
zu bestimmen. Man kann nämlich Beispiele anführen, in denen für verschiedene 
Verteilungsfunktionen alle Momente ganzzahliger Ordnung übereinstimmen. 
Im Zusammenhang damit erhebt sich die folgende Frage (das Momentenproblem): 
Gegeben sei eine Folge konstanter Zahlen 


sale, in... 


1. Unter welchen Bedingungen existiert eine Verteilungsfunktion F(x) derart, 
daß für alle n die Gleichungen 


„= [a* dF(e) 
bestehen, 


2. wann ist diese Funktion eindeutig bestimmt ? 

Heute ist diese Aufgabe vollständig gelöst. Wir verweilen jedoch nicht länger 
bei ihr, da sie über den Rahmen dieses Buches hinausgeht. 

Unter den übrigen zahlenmäßigen Charakteristiken einer Zufallsgröße spielen 
die sog. Semiinvarianten eine wesentliche Rolle. Ihre Definition stellen wir 
bis zum Kapitel VII zurück, hier bemerken wir nur folgendes. Bei der Addition 
unabhängiger Zufallsgrößen ist das Moment einer Summe im allgemeinen nicht 
gleich der Summe der Momente der Summanden. Für das Moment der Summe 
zweier unabhängiger Zufallsgrößen £ und n gilt die Gleichung 


ME + m* -2a ME Mat =#. 


Die Semiinvarianten verschiedener Ordnungen besitzen die Eigenschaft, daß 
bei der Addition unabhängigerSummanden dieSemiinvariante der Summe gleich 
der Summe der Semiüinvarianten der Summanden derselben Ordnung ist. Es 
zeigt sich, daß die Semiinvariante einer beliebigen Ordnung k eine rationale 
Funktion der Momente von der Ordnung kleiner oder gleich k ist. 


Übungen 


1. Eine Zufallsgröße & nehme nur ganze nichtnegative Werte mit den Wahrscheinlich- 
keiten 


a) Pf£f=k)= rar a > 0 ist eine Konstante (PascArsche Verteilung), 
& Eıd( Pe | k—1 
De) +A ud, LER für k>0 


(PoLyasche Verteilung), 


ı 
PP=Pf£=0}=(1+ap) Pf, a>0, 8>0 
an. Man bestimme M& und D£. 
13* 
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2. 


10. 


V. Zahlenmäßige Charakterisierung der Zufallsgrößen 


# sei die Anzahl des Eintretens eines Ereignisses A in n unabhängigen Versuchen, 
in jedem Versuch sei P(A) = p. Gesucht ist 


Ma, b)Mus 0) Mlu—npl. 


. Die Wahrscheinlichkeit für das Eintreten eines Ereignisses A im i-ten Versuch sei 


gleich p;. # sei die Anzahl des Eintretens des Ereignisses A in den ersten n unab- 
hängigen Versuchen. Man bestimme 


n 3 n 4 
Se de 3Mlu- En). aml- Sr). 


. Man beweise, daß unter den Bedingungen der vorigen Aufgabe das Maximum von 
n 


1 
Du bei gegebenem Wert a = = P> p; imFallep, =7, = :-- = 9, = a angenommen 
wird. = 


. # sei die Anzahl des Eintretens eines Ereignisses A in n unabhängigen Versuchen, 


wobei in jedem Versuch P(A) = p ist. Ferner sei 7 gleich Null oder Eins in Abhängig- 
keit davon, ob u gerade oder ungerade ist. Man bestimme M n. 


. Die Verteilungsdichte einer Zufallsgröße £& sei gleich 


e—al 


Pe * 


(LarLacesche Verteilung). Man bestimme M& und D£. 


. Die Verteilungsdichte des absoluten Betrages der Geschwindigkeit eines Moleküls 


wird durch das Maxwerusche Gesetz 
.ı _? 
e fürx>0 


nam Vm 
und p(2) =0 für 2<0(&>0, konstant) gegeben. Gesucht ist die mittlere Ge- 
schwindigkeit eines Moleküls und ihre Dispersion, die mittlere kinetische Energie 
eines Moleküls (die Molekülmasse sei gleich m) und die Dispersion der kinetischen 
Energie, ; 


. Die Wahrscheinlichkeitsdichte dafür, daß sich ein Teilchen bei der Brownschen Be- 


wegung zum Zeitpunkt tim Abstand x von einer reflektierenden Wand befindet, wenn 

es sich im Zeitpunkt it, = 0 im Abstand x, davon befunden hat, wird durch die Formel 
(a+2) _&@-a) 

e Di +e 4Dt für x >o0 


Pe) = 2yn Di 


gegeben — für x < 0 ist p(z) = 0. 
Man bestimme die mathematische Erwartung und die Dispersion der Verschiebungs- 
größe des Moleküls in der Zeit von t = 0 bis t. 


. Man beweise, daß für eine beliebige Zufallsgröße £, deren mögliche Werte sich im 


Intervall (a, b) befinden, die folgenden Ungleichungen erfüllt sind: 


2 
%p %gp ++», %; seien die möglichen Werte einer Zufallsgröße &. Man beweise, daß für 
n— oo die Beziehungen 


Me&nr+1 DDR 
——— max %, > max 
Mir ce ' 1Sj<% " 


b—a\ 
a<ME<b, De <( *)- 


a) 


bestehen. 


11. 


12. 


13. 


14. 
15. 


16. 


17. 


18. 


19. 
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F(x) sei die Verteilungsfunktion von &. Man beweise, daß unter der Annahme der 
Existenz von M£ die Beziehung 


M&= S[1— Fa) + F-a)] de 
0 


besteht und daß für die Existenz von M & die Beziehungen 
lim x F(x) = lim x[1— F(x)] = 0 
89 x>+0 
notwendig sind. 


Auf das Intervall (0, 1) werden auf gut Glück zwei Punkte geworfen. Gesucht ist 
die mathematische Erwartung und die Dispersion des Abstands zwischen ihnen, so- 
wie die mathematische Erwartung der n-ten Potenz dieser Größe. 


Eine Zufallsgröße £& sei logarithmisch normal verteilt, d.h., für > 0 sei die Ver- 
teilungsdichte von £ gleich 
1 (In z—a)" 


1 nn 
x) = ——e 2#' für >0 
p(z) Bayan 


[für x < 0 ist p(x) = 0]. Man bestimme M& und D.&. 

(A. N. KoLMoGoROFTF zeigte, daß die Korngrößen bei der Zerkleinerung von Materialien 
nach dem logarithmisch normalen Gesetz verteilt sind.) 

Eine Zufallsgröße £ sei normal verteilt. Man bestimme M |? —a| mit a=ME&. 


In einem Kasten sind 2" Kärtchen enthalten, die Nummer & (= (0, 1,...,n) stehe 
auf C%, von ihnen. Nun werden auf gut Glück m Kärtchen herausgegriffen; s bezeichne 
die Summe der auf ihnen angegebenen Nummern. Man bestimme M sundD s. 


Die Zufallsgrößen € und n seien unabhängig und normal verteilt mit ein und denselben 
Parametern a und o. Man bestimme den Korrelationskoeffizienten der Größen 
a&E+ßn,2&—Pn und ihre gemeinsame Verteilung. 


Der Zufallsvektor (£, 7) sei normal verteilt; es sei ferner MEe=a,Mn =b,Di= oJ, 
Dn=0oj3, R sei der Korrelationskoeffizient zwischen & und 7. Man beweise, daß 
R= cos grist mit g = P{(& — a) (n—b) < 0}. 


%, 2, seien die Ergebnisse zweier unabhängigen Beobachtungen an einer normal ver- 


teilten Zufallsgröße &. Man beweise die Beziehung M max (,%)=a-+ I mit 
a=M&0=D%. yr 


Der Zufallsvektor (£, 7) sei normal verteilt, es sei fernerM2=Mn=0, DE=Dn=1, 
MEn= o. Man beweise die Beziehung 


Mmax (&,n) = Y1—. 


. Als Maß für die Ungleichmäßigkeit der Baumwolle bezüglich ihrer Länge nimmt man 


die Größe 
— a' 


Dabei ist « die mathematische Erwartung der Faserlänge, «a’' ist die mathematische 
Erwartung der Länge der Fasern, deren Länge größer als a ist, a’ ist die mathematische 
Erwartung der Länge der Fasern, deren Länge kleiner als « ist. Man suche einen 
Zusammenhang zwischen den Größen 

a) A,aundMlE —al; ; 

b) A, a und o, wenn die Faserlänge & normal verteilt ist. 


VI. 
DAS GESETZ DER GROSSEN ZAHLEN 


$ 31. Massenerscheinungen und das Gesetz der großen Zahlen 


Die. umfangreichen von der Menschheit angesammelten Erfahrungen zeigen, 
daß Erscheinungen, die eine Wahrscheinlichkeit nahe Eins besitzen, fast immer 
eintreten. Ebenso treten Ereignisse, deren Wahrscheinlichkeit sehr klein, mit 
anderen Worten sehr nahe an Null ist, sehr selten ein. Dieser Tatbestand 
spielt für viele praktische Schlußfolgerungen aus der Wahrscheinlichkeitsrech- 
nung eine grundlegende Rolle, da die erwähnte Erfahrungstatsache esin der 
Praxis gestattet, wenig wahrscheinliche Ereignisse für praktisch unmöglich 
und Ereignisse mit Wahrscheinlichkeiten nahe an Eins für praktisch sicher 
anzunehmen. Doch kann man auf die ganz natürliche Frage, wie groß eine 
Wahrscheinlichkeit sein muß, damit man ein Ereignis für praktisch unmöglich 
halten kann, keine eindeutige Antwort geben. Das ist auch verständlich, da man 
im praktischen Leben die Wichtigkeit der Ereignisse berücksichtigen muß, mit 
denen man es zu tun bekommt. Wenn es sich z. B. zeigt, daß bei einer Messung 
des Abstandes zwischen zwei Ortschaften dieser Abstand gleich 5340 m und der 
Fehler dieser Messung mit der Wahrscheinlichkeit 0,02 größer oder gleich 20 m 
ist, so können wir die Möglichkeit eines großen Fehlers vernachlässigen und an- 
nehmen daß der Abstand wirklich gleich 5340 m ist. In diesem Beispiel halten 
wir also,ein Ereignis mit der Wahrscheinlichkeit 0,02 fürunwesentlich und berück- 
sichtigen es nicht in der praktischen Tätigkeit. Gleichzeitig kann es möglich sein, 
daß man in anderen Fällen Wahrscheinlichkeiten von 2% und noch kleinere nicht 
vernachlässigen darf. Wenn es sich z. B. beim Bau eines großen Wasserkraft- 
werkes, das einen beträchtlichen Aufwand an Material und Menschenkraft 
erfordert, zeigt, daß die Wahrscheinlichkeit einer Hochwasserkatastrophe unter 
den betrachteten Bedingungen gleich 0,02 ist, so wird man diese Wahrscheinlich- 
keit für sehr groß halten und sie bei der Projektierung der Station unbedingt 
berücksichtigen und nicht vernachlässigen, wie wir es im vorigen Beispiel taten. 
So können uns also nur die Erfordernisse der Praxis Kriterien dafür liefern, wann 
wir das eine oder andere Ereignis für praktisch unmöglich oder praktisch sicher 
halten können. 

Gleichzeitig muß man jedoch bemerken, daß jedes beliebige Ereignis, das eine 
positive Wahrscheinlichkeit besitzt, wie klein auch immer diese Wahrscheinlich- 
keit sein mag, dennoch eintreten kann; und wenn die Anzahl der Versuche, in 
denen es stets mit ein und derselben Wahrscheinlichkeit eintreten kann, sehr 
groß ist, so wird die Wahrscheinlichkeit dafür, daß das Ereignis bei diesen vielen 
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Versuchen wenigsten einmal eintritt, doch sehr nahe an Eins sein. Diesen Um- 
stand muß man beachten. Wenn jedoch die Wahrscheinlichkeit eines Ereig- 
nisses sehr klein ist, so ist kaum zu erwarten, daß esin einem vorher bestimm- 
ten Versuch eintritt. Wenn also jemand behauptet, daß bei der ersten Austei- 
lung der Karten unter vier Partner jeder nur Karten von einer Farbe erhält, 
so wird man natürlich den Verdacht hegen, daß sich der Geber der Karten bei 
der Verteilung von irgendwelchen Gesichtspunkten leiten läßt, daß etwa die 
Karten in einer dem Geber bekannten Anordnung liegen. Diese Überzeugung 
gründet sich darauf, daß die Wahrscheinlichkeit eines solchen Ereignisses bei 
gutem Mischen der Karten gleich (91)841/361<< 1,1.10°44, also winzig klein ist. 
Dennoch kann natürlich einmal eine solche Verteilung der Karten eintreten. 
Dieses Beispiel illustriert hinreichend den Unterschied zwischen den Begriffen 
der, praktischen Unmöglichkeit und der sozusagen kategorischen Unmöglichkeit. 

Aus all dem wird verständlich, daß im praktischen Leben, ja auch in den all- 
gemein-theoretischen Aufgaben. die Ereignisse mit Wahrscheinlichkeiten nahe 
an Eins oder Null eine große Be teutung haben. Es wird hieraus klar, daß eine 
der Hauptaufgaben der Wahrscheinlichkeitsrechnung die Aufstellung von 
Gesetzmäßigkeiten sein muß, die mit"Wahrscheinlichkeiten nahe an Eins gelten; 
eine besondere Rolle müssen dabei die Gesetzmäßigkeiten spielen, die sich 
als Resultat der Wirkung einer sehr großen Anzahl unabhängiger oder schwach 
abhängiger zufälliger Faktoren ergeben. Das Gesetz der großen Zahlen ist einer 
dieser Sätze der Wahrscheinlichkeitsrechnung, und zwar der wichtigste. 

Unter dem Gesetz der großen Zahlen könnte man jetzt natürlich die Gesamt- 
heit aller Sätze verstehen, die mit einer Wahrscheinlichkeit beliebig nahe an Eins 
behaupten, daß ein gewisses Ereignis eintritt, das von einer unbeschräukt 
wachsenden Anzahl zufälliger Ereignisse abhängt, von denen jedes auf dieses 
Ereignis nur einen unwesentlichen Einfluß nimmt. Diese allgemeine Vor- 
stellung von den Sätzen vom. Typus des Gesetzes der großen Zahlen läßt sich 
auch noch etwas genauer formulieren: Gegeben sei eine Folge von Zufallsgrößen 


TER SEES RER (1) 


Wir betrachten die Zufallsgrößen /,, die gewisse vorgegebene symmetrische 
Funktionen der ersten n Größen der Folge (1) sind: 


Inner ar. sän): 


Wenn eine Folge von Konstanten q,, 4, . . . » das - . . eXistiert derart, so daß bei 
beliebigem e > 0 die Beziehung 


lim P{—a|<e}=1 (2) 


besteht, so ist die Folge (1) dem Gesetz der großen Zahlen mit vorgegebenen 
Funktionen f, unterworfen. 

Gewöhnlich legt man jedoch in den Begriff des Gesetzes der großen Zahlen 
einen viel bestimmteren Inhalt. Man beschränkt sich nämlich auf den Fall, 
daß /„ das arithmetische Mittel der Größen £&,, & . . . , &, ist. 
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Wenn in der Beziehung (2) alle Größen a, gleich ein und derselben Größe a 
sind, so sagt man, die Zufallsgrößen £, konvergieren in Wahrscheinlichkeit gegen 
a. In diesen Begriffen besagt die Beziehung (2), daß £, — a, in Wahrscheinlich- 
keit gegen 0 konvergiert. 

Wenn wir eine einzelne Erscheinung beobachten, so beobachten wir sie mit 
allen ihren individuellen Besonderheiten, so daß diejenigen Gesetzmäßigkeiten 
nicht erkennbar werden, die bei der Beobachtung einer großen Anzahl analoger 
Erscheinungen auftreten. Daß die für das Wesen eines Prozesses als Ganzes 
nicht ausschlaggebenden Faktoren, die nur in einzelnen Realisierungen bemerk- 
bar werden, sich bei der Betrachtung des Mittels aus einer großen Anzahl von 
Beobachtungen gegenseitig auslöschen, wurde schon früh erkannt. In der Folge 
wurde dieses empirische Resultat immer häufiger festgestellt, doch in der Regel 
ohne den Versuch, eine theoretische Erklärung dafür zu finden. Viele Autoren 
brauchten eine solche Erklärung übrigens auch nicht, da das Vorhandensein 
von Gesetzmäßigkeiten sowohl in den Erscheinungen der Natur wie in den 
gesellschaftlichen Erscheinungen für sie nichts anderes war als das Walten 
einer göttlichen Ordnung. 

Einige Autoren haben bis heute die Aussagekraft des Gesetzes der großen 
Zahlen herabgesetzt und seine methodologische Bedeutung entstellt, indem sie 
es einfach als eine in der Erfahrung zu beobachtende Gesetzmäßigkeit erklärten. 
Der bleibende wissenschaftliche Wert der Untersuchungen von TSCHEBYSCHEWw, 
MARKow und anderen Forschern auf dem Gebiete des Gesetzes der großen 
Zahlen besteht nicht darin, daß sie die empirische Stabilität der Mittelwerte 
feststellten, sondern darin, daß sie die allgemeinen Bedingungen fanden, welche 
die statistische Stabilität der Mittel mit Notwendigkeit zur Folge haben. 

Zur Veranschaulichung der Wirkungsweise des Gesetzes der großen Zahlen 
führen wir das folgende schematische Beispiel an. Nach der heutigen physika- 
lischen Anschauung besteht jedes Gas aus einer ungeheuren Menge einzelner 
Teilchen, die sich in einer unaufhörlichen ungeordneten Bewegung befinden. 
Von jedem einzelnen Molekül kann man nicht von vornherein sagen, mit wel- 
cher Geschwindigkeit es sich bewegen wird, und an welcher Stelle es sich zu einem 
vorgegebenen Zeitpunkt befinden wird. Jedoch können wir für ein Gas, das sich 
unter bestimmten Bedingungen befindet, denjenigen Teil der Moleküle ab- 
schätzen, die sich mit einer vorgegebenen Geschwindigkeit bewegen werden, oder 
den Anteil derjenigen, die sich in einem vorgegebenen Volumen befinden werden. 
Gerade das wollen aber auch die Physiker wissen. Die Zustandsgrößen eines 
Gases — Druck, Temperatur, Zähigkeit u. a. — werden nicht durch das kom- 
plizierte Verhalten eines einzigen Moleküls, sondern durch das Zusammen- 
wirken aller Moleküle bestimmt. So ist z.B. der Druck eines Gases gleich der 
summarischen Einwirkung der Moleküle, die in der Zeiteinheit auf die Flächen- 
einheit auftreffen. Die Anzahl und die Geschwindigkeiten der auftreffenden 
Moleküle ändern sich in Abhängigkeit vom Zufall. Nach dem Gesetz der großen 
Zahlen (in der Form von TScHEBYScHEw) muß jedoch der Druck fast konstant 
sein. Dieser „ausgleichende‘‘ Einfluß des Gesetzes der großen Zahlen läßt sich 
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in den physikalischen Erscheinungen ausnahmslos beobachten. Man braucht 
nur daran zu erinnern, daß, etwa unter den üblichen Bedingungen, sogar 
äußerst genaue Messungen nur sehr schwer eine Abweichung vom PAsoALschen 
Gesetz über den hydrostatischen Druck feststellen lassen. Den Gegnern des 
molekularen Aufbaues der Materie diente diese durchweg gute Übereinstim- 
mung der Resultate der Theorie mit der Erfahrung sogar als originelles Argu- 
ment: Wenn die Materie einen molekularen Aufbau besäße, so müßte man auch 
Abweichungen vom PascAuschen Gesetz feststellen können. Diese Abweichun- 
gen, die sog. Fluktuationen des Druckes, konnte man auch tatsächlich beob- 
achten, wenn man eine verhältnismäßig kleine Anzahl von Molekülen isolierte, 
wodurch sich der Einfluß der einzelnen Moleküle schon nicht mehr vollständig 
ausglich und noch hinreichend stark blieb. 


$ 32, Das Gesetz der großen Zahlen in der Tschegvschewschen Form 


Wir kommen nun zur Formulierung und zum Beweis der Sätze von TscHr- 
BYSCHEW, MARKoOwW und anderen; die dabei benutzte Methode stammt von 
TSCHEBYSCHEW. 

Die Tsouzsyscuzwsche Ungleichung. Für eine beliebige Zufallsgröße £, 
die eine endliche Dispersion besitzt, gilt für jedes e > 0 die Ungleichung 


D 
PiE—Mel>2e}<®. () 
Beweis. Bezeichnet F(x) die Verteilungsfunktion der Zufallsgröße &, so ist 
P{Ee—M&>e}= [ dF@. 
le—Mil>s 


Da im Integrationsgebiet 


ist, erhalten wir 
dF@) <4 j («— M S® dF@) ., 
le—Mil2s . e—M£l>s 


Wir vergröbern diese Ungleichung nur, wenn wir die Integration über alle 
Werte x erstrecken 


dr) <a | @— Mirdr@) =". 
Ie—Mil>e 
Die Tschzgyscazwsche Ungleichung ist damit bewiesen. 

Satz von TSCHEBYSCHEw. Ist &,&4.-.,&u... eine Folge paarweise 
unabhängiger Zufallsgrößen, deren Dispersionen gleichmäßig beschränkt sind 
DEE, DEZSC..., DE SO. 

so ist bei beliebig vorgegebenem konstantem e > 0 


lim Im P{L 413-1 M&; 


k=1 


<el=1. (2) 
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Beweis. Wir wissen, daß unter den Bedingungen des Satzes 
ı X ıY 
(55)-20% 
ı% c 
(4 35)<2 


k=1 


und demnach auch 


ist. Auf Grund der TSCHEBYSCHEwschen Ungleichung ist 


Gehen wir nun zum Grenzwert für n — ooüber, so erhalten wir die Beziehung 
n n 
lim ef ENT 
no (*E1 nn 
Da aber die Wahrscheinlichkeit nicht größer als Eins sein kann, ergibt sich hier- 
aus die Behauptung des Satzes. 
Es seien noch einige wichtige Spezialfälle des TscHeByYschzwschen Satzes 
angeführt. 
1. Satz von BERNoULLI. Es sei u die Anzahl des Eintretens eines Ereig- 
nisses A in n unabhängigen Versuchen, in jedem dieser Versuche sei die Wahr- 


scheinlichkeit für das Eintreten des Ereignisses A gleich p. Dann ist bei beliebigem 
e>0 


<d21. 


lim P | 
n>00 


#-2|<el=1. (3) 


Beweis. Führt man die Zufallsgrößen u; ein, die gleich der Anzahl des Ein- 
tretens des Ereignisses A beim k-ten Versuch sind, so hat man 


A=hmtMrt' tim: 
Da aber 


1 
Mu=Pp, Du=pqa<z 


ist, ist der Satz von BERNOULLI ein einfacher Spezialfall des TscHEBYSCHEW- 
schen Satzes. 

Da man in der Praxis häufig Näherungswerte für unbekannte Wahrschein- 
lichkeiten allein aus der Erfahrung bestimmen muß, führte man zum Nachweis 
der Übereinstimmung des Bernovrischen Satzes mit der Erfahrung eine große 
Anzahl von Versuchen aus. Dabei betrachtete man Ereignisse, deren Wahr- 
scheinlichkeiten man aus irgendwelchen Überlegungen heraus als bekannt an- 
nehmen kann, für die man leicht Versuche ausführen kann, und bei denen die 
Unabhängigkeit der Versuche sowie die Konstanz der Wahrscheinlichkeiten in 
jedem Versuch gesichert ist. Alle genaueren Untersuchungen ergaben eine aus- 
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Tabelle 11 


Nr. des „Asmebl der elative Nr. des Anzahl der ‚ahl der relative 
Versuchs tigen Fälle släutigent | Versuchs | roten Karten |gün edlen Fülle Häufigkeit 


vom —- 
@ 0 0 m DD [CD 100 D 


dm 


nd 


0 
1 
1 
2 
2 
2 
2 
3 
3 
3 
3 
3 
4 
4 
4 
4 
E 
4 
4 
4 
4 
4 
Es 
5 
6 
6 
7 
7 
7 
7 
7 
7 
7 
7 
8 
9 
9 
9 
9 
9 


mi 


a) 
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gezeichnete Übereinstimmung mit der Theorie. Wir führen hier die Resultate 
einiger solcher leicht ausführbarer Experimente an. 

Ein Kartenspiel aus 36 Karten werde 100 mal auf gut Glück in zwei gleiche 
Teile geteilt. In der Tabelle 11 findet man die Resultate dieses Experiments. 
In der ersten Spalte steht die Nummer des Versuchs, in der zweiten die Anzahl 
der in einer der Hälften auftretenden roten Karten, in der dritten die Anzahl 
der Fälle unter den bereits ausgeführten Versuchen, in denen die roten und 
schwarzen Karten sich in beiden Stößen in gleicher Anzahl vorfanden, in der 
vierten Spalte findet man schließlich die Werte der relativen Häufigkeiten. 


50 
Abb. 20 


Im Beispiel 3, $5, wurde berechnet, daß die Wahrscheinlichkeit, in einer 
Hälfte gleich viel schwarze und rote Karten zu finden, gleich 


_ use _ 
P = za: — 926 
ist. 
Die Kurve in Abb. 20 stellt anschaulich die Änderung der relativen Häufig- 
keit in Abhängigkeit von der Anzahl der Versuche dar. Am Anfang, wo die 


Anzahl der Versuche noch nicht groß ist, weicht die Kurve bisweilen recht 
merklich von der Geraden y = p = 0,26 ab. Danach kommt sie mit wachsender 
Anzahl der Versuche im großen und ganzen dieser Geraden immer näher. 

In dem betrachteten Falle erhält man (für n = 100) eine recht bemerkens- 
werte Abweichung der relativen Häufigkeit von der Wahrscheinlichkeit (die 
Differenz beträgt ungefähr 0,02). Nach dem Satz von Larrace ist die Wahr- 
scheinlichkeit für das Auftreten einer solchen oder noch größeren Abweichung 
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> 02V} 1-2 0(002Y2) 


=1—2® (0 02 Ver ar) = 1— 2 (0,455) —0,65 . 


gleich 


k a 
Pf 2) > 002} -P| 


Wenn also das angegebene Experiment noch sehr oft wiederholt wird, so wird 
man ungefähr in zwei von drei Fällen eine Abweichung feststellen, die nicht 
kleiner als die in unserem Versuch erhaltene sein wird. 

Burron, ein französischer Naturforscher des 18. Jh., warf eine Münze 4040 
mal, dabei warf er 2048 mal „Kopf“. Die relative Häufigkeit des Auftretens des 
Ereignisses „Kopf“ im Burroxschen Versuch ist ungefähr gleich 0,507. 

Der englische Statistiker K. PzArsox warf eine Münze 12000 mal und beob- 
achtete dabei 6019 mal das Ereignis „Kopf“. Die relative Häufigkeit für das 
Auftreten des Ereignisses „Kopf“ in diesem PeArsonschen Versuch ist gleich 
0,5016. 

Ein anderes Mal warf er eine Münze 24000 mal, „Kopf“ fiel dabei 12012 mal]; 
die relative Häufigkeit des Auftretens des Ereignisses ‚Kopf‘ erwies sich hier 
als 0,5005. In allen angeführten Versuchen wich die Frequenz nur wenig von 
der Wahrscheinlichkeit 0,5 ab. 


he > 
Yrpq 


2. Satz von Poısson. Wenn in einer Folge unabhängiger Versuche die 
Wahrscheinlichkeit des Eintretens eines Ereignisses A beim k-ten Versuch gleich p, 
ist, so ist 

lim P k_ MmMtPMt''‘t Pa <e=1. 

n>0 n ”% 
Wie gewöhnlich bezeichnet dabei u die Anzahl des Eintreiens des Ereignisses A 
in den ersten n Versuchen. 

Wenn wir die Zufallsgrößen 4, einführen, die gleich der Anzahl des Eintretens 
des Ereignisses A beim k-ten Versuch sind und die Beziehungen 


" 1 
Mu=P:; Du=Pp%<z 


beachten, so überzeugen wir uns leicht davon, daß der Satz von Poıssox ein 
Spezialfall des TSCHEBYscHEwschen Satzes ist. 


3. Eine Folge paarweise unabhängiger Zufallsgrößen &,, &».-- > &n, . . . genüge 
den Bedingungen 
M&= M&=-. =M&=---=a 
und 
DE<C, DE SG DE <G, 5 


dann ist bei beliebigem e > 0 


lim Im {| 


Na-—a 


n 41 


<d=1. 
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Dieser Spezialfall des Tsouzsyschezwschen Satzes gibt die Grundlage für 
die Regel des arithmetischen Mittels, die in der Meßlehre ständig benutzt wird. 
Angenommen, es solle eine physikalische Größe a gemessen werden. Wird die 
Messung rn mal unter den gleichen Bedingungen ausgeführt, so erhält der 
Beobachter die Resultate 2,2, ...,2, die nicht alle miteinander überein- 
stimmen. Als approximativen Wert a nimmt man gewöhnlich das arithmetische 
Mittel aus den Versuchsergebnissen 
„atatı tm , 

n 


a 


Wenn in der Messung kein systematischer Fehler steckt, d. h., wenn 
My,=Mz=--=Mxz,=a 


ist, und wenn der Beobachtung des Wertes keine Unsicherheit (z.B. durch 
beschränkte Ablesegenauigkeit am Meßgerät) anhaftet, so können wir nach 
dem Gesetz der großen Zahlen auf die angegebene Weise für hinreichend große 
Werte rn mit einer Wahrscheinlichkeit beliebig nahe an Eins einen Wert erhalten, 
welcher der gesuchten Größe a beliebig nahe kommt. 

Im Falle gleichverteilter unabhängiger Summanden kann man mit Hilfe der 
TscHegyscHewschen Ungleichung noch ein schärferes Resultat ableiten. 


Satz von A. J. CuıntscoHin. Wenn die Zufallsgrößen &,, &, .. . unab- 
hängig und gleichverteilt (nach der Verteilungsfunktion F(x)) sind und eine end- 
liche mathematische Erwartung besitzen (a= M &,), so ist für n — co 


1 n 
P | Se & —ä 
Beweis. Beim Beweis benutzen wir ein Verfahren, das als erster A. A. 
Markow im Jahre 1907 verwandte und die Bezeichnung „Meihode der Ver- 
kürzung‘ erhielt. Dieses Verfahren wird in der modernen Wahrscheinlichkeits- 
rechnung häufig benutzt. 


Wir definieren neue Zufallsgrößen auf folgende Weise: ö > 0 sei festgehalten, 
und fürk=1,2,...,n sei 


<d4=1. 


7. = &n = 0, wenn |< ön ist; 
.=0, = &, wenn |&| > ön ist. 
Offenbar ist bei beliebigem k(1 <k<n) 
:=nm+L- 


Die Größen n; besitzen mathematische Erwartungen und endliche Dispersionen: 


4 = Mn = [ zdF@), 
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Dy, = T- zdF(@)— ad<ön f e|dF(@) <öbn, 
an 


wobei b = 3. [x] dF(e) . 


Delirn se 
a„>a, 


ist bei beliebig vorgegebenem e& > 0 für genügend großes n 
.—al<e. (4) 


Auf Grund der TsohzgyscH&wschen Ungleichung ist 


ı x bö 
ef Man >.1<i 
Nach Ungleichung (4) folgt hieraus 
ı x bö 
Pf ma >2.1<H 


Ferner ist 
ı 
P{ü#0)= [dr@<; | klare); 
elzön elzön 
die rechte Seite läßt sich für hinreichend großes n auf Grund der Existenz 


der mathematischen Erwartung kleiner als 2 machen. Nun ist aber 


Sard<ruence 


k-1 
daher wird 


e/ PA >2d<P[1 Ina >24 iu ro<i+ 5. 
Ri ne = 5 


Da e und ö beliebig sind, läßt sich die rechte Seite kleiner als jede beliebig vor- 
gegebene Zahl machen; der Satz ist damit bewiesen. 

Wir formulieren nun noch einen Satz von A. A. MArkow, der eine evidente 
Folgerung aus der TscHegyscHzwschen Ungleichung ist. 


Satz von MArKow. Wenn eine Folge von Zufallsgrößen &,&,... für 


n — ooder Beziehung 
1 n 
5 0(2, &) >0 6) 


genügt, so ist bei beliebigem konstantem & 


Im P{|t Zi 12 M&|< 
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Wenn die Zufallsgrößen paarweise unabhängig sind, läßt sich die MARKOw- 
sche Bedingung folgendermaßen schreiben: Für n — oo ist 


1 
3% D &; —0. 
Hieraus ersieht man, daß der Satz von TscHEBYScoHEw ein Spezialfall des 
Markowschen Satzes ist. 
Als unmittelbare Folgerung aus dem Satz von MArkow erhalten wir jetzt 
einen Satz, der ebenfalls auf MARKow zurückgeht. 
Satz: Sei u die Anzahl des Eintreiens des Ereignisses E in n Versuchen, die 
durch eine homogene Markowsche Kette miteinander verknüpft sind; p,, Pa - - 
seien die Wahrscheinlichkeiten für das Eintreten von E im ersten, zweiten 
usw. Versuch (gemäß dem Schema von $ 20); dann gilt bei beliebigem & > 0 
im Pl Dm<el=1. (6) 
n>00 n ne 
Der Beweis dieses Satzes ist offensichtlich auf Grund der Resultate des Bei- 
spiels 6, $ 28. 
Die Resultate dieses Beispiels besagen aber auch, daß 


1 n 
= P=p+oll), 
k=1 
und deshalb ist (6) gleichbedeutend mit der Gleichung 
. BB u 
lim Pit p< | ip 


N->00 
In dieser Formulierung stellt der angeführte Satz offensichtlich eine Verall- 
gemeinerung des Satzes von BERNoTLLI dar. 


$ 33. Eine notwendige und hinreichende Bedingung für das Gesetz 
der großen Zahlen 

Wir wiesen bereits darauf hin, daß das Gesetz der großen Zahlen einer der 
grundlegenden Sätze der Wahrscheinlichkeitsrechnung ist. Hiernach ist es 
verständlich, warum soviel Nachdruck darauf gelegt wird, die allgemeinsten 
Bedingungen zu ermitteln, denen die Größen &,, &» .. ., & . . . genügen müssen, 
damit für sie das Gesetz der großen Zahlen gilt. 

Die Geschichte des Problems ist die folgende. Um das Jahr 1700 fand 
JAKOB BERNOULLI den Satz, der heute seinen Namen trägt. Der Satz von 
BernovLıı wurde 1713 nach dem Tode des Autors in dem Traktat „Ars con- 
jeetandi‘ (die Kunst, Vermutungen aufzustellen) zum erstenmal veröffentlicht. 
Danach bewies am Anfang des 19. Jh. Poıssox einen analogen Satz unter 
allgemeineren Bedingungen. Bis zur Mitte des 19. Jh. wurden keine weiteren 
Erfolge erzielt. Im Jahre 1866 fand der große russische Mathematiker P. N. 
TSCHEBYSCHEW die von uns im vorigen Paragraphen dargelegte Methode. 
später bemerkte A. A. Markow, daß man mit Hilfe der TscHrByschzwschen 
Überlegung ein noch allgemeineres Resultat erhalten kann (siehe $ 32). 
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Weitere Bemühungen führten zu keinen prinzipiellen Erfolgen. Erst im 
Jahre 1926 fand A. N. KoLmoGoRoFF notwendige und hinreichende Bedingungen 
dafür, daß eine Folge paarweise unabhängiger Zufallsgrößen &, &3 ..., En: - 
dem Gesetz der großen Zahlen unterworfen ist. Im Jahre 1928 zeigte A. ]J. 
Camrschin, daß die Existenz des Erwartungswertes MZ, eine hinreichende 
Bedingung für die Anwendbarkeit des Gesetzes der großen Zahlen darstellt, 
wenn die Zufallsgrößen £, nicht nur unabhängig sind, sondern auch die gleiche 
Verteilungsfunktion besitzen. 

In den letzten Jahren wurde viel Mühe darauf verwandt, Bedingungen fest- 
zustellen, die man abhängigen Größen auferlegen muß, damit für sie das Gesetz 
der großen Zahlen gilt. Der Satz von MArkow gehört zu den Sätzen dieser Art. 

Unter Benutzung der TSCHEBYScHEwschen Methode kann man leicht eine 
Bedingung gewinnen, die der MArkowschen Bedingung analog, aber nicht 
nur hinreichend, sondern auch notwendig für die Anwendbarkeit des Gesetzes 
der großen Zahlen auf eine Folge von beliebigen Zufallsgrößen ist. 


Satz. Eine Folge Er äp öu:-- 


(eventuell auch voneinander abhängiger) Zufallsgrößen genügt bei beliebigem posi- 
tivem e dann und nur dann der Beziehung 


impfjt + mal<da1, (1) 
n k= 
wenn für n — © (2 m) 

MA. 2-39 (2) 


n 2 

m + ( z (Mn) 

gilt. a 
Beweis. Wir setzen zunächst voraus, daß die Bedingung (2) erfüllt sei, und 
zeigen, daß in diesem Falle auch (1) erfüllt ist. Wir bezeichnen mit ®,(x) die 

Verteilungsfunktion der Größe | 


1 3, | 
Te (—M3). | 
k=1 
Man prüft leicht die folgende Kette von Ungleichungen nach: 


ax >} = P{m| > e} 


k=1 


Diese Ungleichung beweist, daß die Bedingung unseres Satzes hinreichend ist. 


t) Die letzte Gleichung schreiben wir auf Grund der Formel 


(siehe Satz 1, $ 27). Mf&) =/ Ha) dFa(a) 


14 Gnedenko 
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Wir zeigen nun, daß die Bedingung (2) auch notwendig ist. Man sieht leicht, 
daß 


P{m|> 2} = | do, > | Fzd0e) 
lelze lel2e 


= 10,0) — 510. («) 


kei<e 


> [ 2 _a0,@W)—-e=M"__a @) 
— /1+m "* 1l+n2 


ist. Folglich ist 


2 
0<M Z3<e+Piml>e}. 


Wählt man zunächst e hinreichend klein und danach n hinreichend groß, so 
läßt sich die rechte Seite der letzten Ungleichung beliebig klein machen. 

Wir bemerken, daß alle im vorigen Paragraphen bewiesenen Sätze sich leicht 
aus dem soeben bewiesenen allgemeinen Satz ergeben. Da nämlich bei beliebi- 
gem n und beliebigem £&;, die Ungleichung 


usm-1Ie- Mo] 


besteht, so ergibt sich hieraus, falls die ne existieren, die Ungleichung 
nn 
MN 1+ n2 — <a D3 &r- 


Wenn also die Markowsche Bedingung erfüllt ist, so ist auch die Bedingung 
(2) erfüllt, und die Folge &, &»...,&%... ist dem Gesetz der großen Zahlen 
unterworfen. 

Wir müssen jedoch bemerken, daß in komplizierteren Fällen, in denen von 
den Größen £, nicht die Existenz der Dispersionen verlangt wird, sich der be- 
wiesene Satz zur tatsächlichen Nachprüfung der Anwendbarkeit des Gesetzes 
der großen Zahlen sehr wenig eignet, da sich die Bedingung (2) nicht auf die ein- 
zelnen Summanden, sondern auf ihre Summen bezieht. Wenn man jedoch keine 
Voraussetzungen über die Größen &, und gewisse Beziehungen zwischen ihnen 
macht, kann man, wie es scheint, nicht damitrechnen, daß es gelingt, notwendig 
und hinreichende Bedingungen zu finden, die außerdem noch für die Anwen- 
dung bequem sind. 

Der praktischen Anwendung der eben bewiesenen Sätze steht eine prinzipielle 
Schwierigkeit entgegen: Dürfen wir annehmen, daß die. von uns untersuchte 
Erscheinung oder der betreffende Produktionsprozeß unter der Wirkung unab- 
hängiger Ursachen vor sich geht? Widerspricht nicht gerade der Begriff der 
Unabhängigkeit unseren Grundvorstellungen über die gegenseitigen Beziehun- 
gen zwischen den Erscheinungen der äußeren Welt? Bei der mathematischen 
Untersuchung irgendeiner Naturerscheinung, eines technischen Prozesses oder 
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irgendeiner gesellschaftlichen Erscheinung müssen wir vor allem unsere Vor- 
aussetzungen auf Grund einer tiefen Untersuchung des Wesens der Erscheinung 
selbst, ihrer qualitativen Besonderheiten treffen. Wir müssen die Veränderun- 
gen der äußeren Bedingungen berücksichtigen, unter denen die zu unter- 
suchende Erscheinung vor sich geht und den mathematischen Apparat und die 
Voraussetzungen, die seiner Anwendung zugrunde liegen, abändern, sobald wir 
beobachten, daß sich die Bedingungen der Realisierung der Erscheinung ge- 
ändert haben. 

Indem sie den Zusammenhang zwischen allen Prozessen der Natur anerkennt, 
weist die materialistische Dialektik gleichzeitig darauf hin, daß diese Zusam- 
menhänge für die eine oder andere Erscheinung wesentlich oder unwesent- 
lich sein können. Die Betrachtung aller überhaupt existierenden Zusammen- 
hänge, unter ihnen auch der unwesentlichen, führt nur dazu, daß die Erschei- 
nung selbst verschleiert und ihre Beherrschung in Anbetracht solcher kompli- 
zierten Verhältnisse verzögert wird. Die für eine vorgegebene Erscheinung un- 
wesentlichen Zusammenhänge dürfen wir nicht berücksichtigen, unsere ganze 
Aufmerksamkeit muß auf die Hauptsache gerichtet sein. 

Wenn wir die unwesentlichen Zusammenhänge zwischen den Ursachen 
weglassen, unter deren Einfluß sich die untersuchte Erscheinung vollzieht, 
besteht die Möglichkeit, nur noch mit unabhängigen Zufallsgrößen zu arbeiten. 
Inwieweit es uns gelungen ist, die Erscheinung zu schematisieren, und inwie- 
weit es uns gelungen ist, den mathematischen Apparat zu ihrer Untersuchung 
aufzubauen, können wir anhand der Übereinstimmung der von uns geschaffenen 
Theorie mit der Praxis beurteilen. Wenn unsere theoretischen Resultate wesent- 
lich von der Erfahrung abweichen, müssen wir die Voraussetzungen über- 
prüfen, insbesondere wenn es um die Anwendbarkeit des Gesetzes der großen 
Zahlen geht; man muß dann möglicherweise die Voraussetzung über die voll- 
ständige Unabhängigkeit der wirkenden Ursachen fallenlassen und zur Vor- 
aussetzung ihrer Abhängigkeit übergehen. 

Wir sagten bereits, daß die bisher gewonnene Erfahrung bezüglich der Anwen- 
dung der Sätze, dieim Zusammenhang mit dem Gesetz der großen Zahlen stehen, 
beweist, daß die Bedingung der Unabhängigkeit in vielen wichtigen Aufgaben 
der Naturwissenschaft und Technik ausreichend ist. 
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Nicht selten zieht man aus dem Satz von BERNOULLI den völlig unbegründeten 
Schluß, daß die relative Häufigkeit eines Ereignisses A bei unbeschränktem 
Anwachsen der Anzahl der Versuche gegen die Wahrscheinlichkeit des Ereig- 
nisses A strebt. In Wirklichkeit stellt der Satz von BerxovLzi jedoch nur die 
Tatsache fest, daß für eine hinreichend große Anzahl von Versuchen n die Wahr- 
scheinlichkeit einer einzigen Ungleichung 


E-< 


14* 
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bei beliebigem n) > 0 größer als 1—n gemacht werden kann. Im Jahre 1909 
bemerkte der französische Mathematiker E. BoREL einen tieferliegenden Satz, 
das sog. slarke Gesetz der großen Zahlen. Zur Formulierung und zum Beweis 
des Satzes von BoREL, sowie allgemeinerer Sätze von A. N. KOLMoOGoROFF 
müssen wir einen neuen wichtigen Begriff einführen — den Begriff der Kon- 
vergenz einer Folge von Zufallsgrößen. 

Gegeben sie eine Folge von Zufallsgrößen, die auf ein und derselben Menge U 
von Elementarereignissen definiert sind: 


ih) (ee). ) 


Wir betrachten die Menge A aller elementaren Ereignisse e, für welche 
die Folge f„(e) konvergiert. f(e) bezeichne den Limes von f,(e) im Punkte e. 
Bezeichnet man mit A}; die Menge aller e, für welche die Ungleichung 


1 
Vale) — Kol <t P) 
erfüllt ist, so wird offensichtlich 


-IO 5 DA. (8) 


Wenn nämlich die Folge der Funktionen /„(e) im Punkte e konvergiert, so 
muß 1. die Ungleichung (2) für alle k bei genügend großem n erfüllt sein, 2. 
müssen diese Ungleichungen von einem gewissen n ab erfüllt sein, 3. müssen 
sie bei beliebigem r für genügend großes n gelten. Die Gleichung (3) faßt 
symbolisch diese drei Forderungen zu einer zusammen. Auf Grund der Gleichung 
(3) und der Definition eines zufälligen Ereignisses gehört die Untermenge A 
zum Wahrscheinlichkeitsfeld. Wir definieren nun die Zufallsgröße £ folgender- 


maßen: Ist ee A, so ist & = f(e), ist aber ee A, sosil=0. 

Ist die Wahrscheinlichkeit des zufälligen Ereignisses A gleich Eins, so sagt 
man, die Folge der Zufallsgrößen &,„ konvergiere gegen die Zufallsgröße & jast 
sicher (oder auch — konvergiere mit der Wahrscheinlichkeit Eins).t) 


1) Der Begriff der fast sicheren Konvergenz entspricht genau dem Begriff der Kon- 
vergenz fast überall in der Theorie der reellen Funktionen. 

In der Wahrscheinlichkeitsrechnung spielt ebenfalls eine große Rolle die sog. Konvergenz 
in Wahrscheinlichkeit: Eine Folge von Zufallsgrößen &, konvergiert gegen eine Zufalls- 
größe £ in Wahrscheinlichkeit, wenn bei beliebig vorgegebenem e > 0 die Wahrscheinlich- 
keit der Ungleichung 

[&n —£ | <e 
für n — oo gegen Eins strebt. 

Die Konvergenz in Wahrscheinlichkeit ist das Analogon der Konvergenz einer Funk- 
tionenfolge dem Maße nach, wie sie in der Theorie der reellen Funktionen betrachtet wird. 

Das Gesetz der großen Zahlen sagt offenbar aus, daß unter gewissen Bedingungen die 


n 
Summen 1" (#,—M &ı) in Wahrscheinlichkeit gegen 0 konvergieren. 
"1 
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Wenn eine Folge £, fast sicher gegen £ konvergiert, so schreiben wir dafür 


P{,>&=1. (4) 
Offenbar läßt sich diese Gleichung auch noch anders schreiben: 
P{n+&}=0. (4) 


Dieser Ausdruck besagt, daß die Wahrscheinlichkeit dafür, daß sich eine 
Zahl r derart angeben läßt, daß für alle n und für wenigstens einen Wert k = k(n) 
die Ungleichung 


1 
[En+x Doz €] > Tr 
gilt, gleich Null ist. 


Wir geben nun eine hinreichende Bedingung dafür an, daß eine Folge von 
Zufallsgrößen mit der Wahrscheinlichkeit Eins konvergiert. 


Hilfssatz. Wenn bei beliebigem ganzem positivem r die Reihe 


Sela-a>!) 0) 


n=1 


konvergiert, so gilt die Beziehung (4) oder, was dasselbe ist, (4°). 


Beweis. Wir bezeichnen mit E/, das Ereignis, daß die Ungleichung 


1 
a —2>-— 
F 
erfüllt ist. Ferner setzen wir 
oo 
= 2% Eur: 
k=1 


Aus der Beziehung 


k) 


EMS SZ PiEn)- $ Pla >t] 


n+1 
leiten wir mit Hilfe der Voraussetzung (5) die Gleichung 
lim P{S7} = 0 (6) 
ab. Sei nun = 
=-SSS.... 
Da das Ereignis S" jedes der Ereignisse S’, zur Folge hat, erhalten wir nach (6) 
P(SN=D2. (7) 
Schließlich setzen wir | 
S=-A+HS24+-S8 4 .... 
Wie man leicht nachprüft, bedeutet dieses Ereignis, daß sich ein r finden läßt 
derart, daß bei beliebiger Wahl vonn (n = 1,2,3,...) jedesmal für wenigstens 
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ein k[k = k(n)] die Ungleichungen 


1 
are >- 
bestehen. Da 
oo 
P(S<LP{S} 
v1 
ist, folgt nach (7) 
P{S}=0, 
q.e.d. 


Wenn wir wörtlich die Überlegungen des soeben durchgeführten Beweises 
wiederholen, können wir einen etwas schärferen Satz gewinnen: 

Wenn eine Folge von ganzen Zahlen 1=n, <nm< --- derart existiert, daß 
die Reihe 


L-} 
Zr max |,—£| < n: 
ki 2 Wp<n<kp+l z 
bei beliebigem ganzem posilivem r konvergiert, so konvergiert die Folge der Zufalls- 
größen &,, & . . . fast sicher gegen £. 

Wir gehen nun zur Anwendung des eingeführten Begriffs und des bewiesenen 
Hilfssatzes über. 


Satz von E. BoREL. u sei die Anzahl des Eintreiens eines Ereignisses A in 
n unabhängigen Versuchen; in jedem dieser Versuche möge das Ereignis A mit 
der Wahrscheinlichkeit p eintreten können. Dann ist für n — co 


Pl&opl=1. 


Beweis. Auf Grund unseres Hilfssatzes brauchen wir zum Beweis des Satzes 
nur die Konvergenz der Reihe 


>} 
2 

n=1 
bei beliebigem natürlichem r nachzuweisen. Dazu bemerken wir, daß man 
auf dieselbe Weise, wie wir das Tschegyschzwsche Lemma ($ 32) bewiesen 


haben, auch zeigen kann: Für jede Zufallsgröße, für die M (£ — M £&)% existiert, 
gilt die Ungleichung 


>) &) 


[7 
Pl ; 


Pie—Mil2e3<ZME—Möl. 
Es ist also 
le s-mlen 


Wir wir es nun schon mehrfach getan haben, führen wir Hilfsgrößen ; ein, die 
gleich der Anzahl des Eintretens des Ereignisses A im i-ten Versuch sind. Da 


#—p=1 Sm) 
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ist, ergibt sich 


n n n 
M(£—p) -II2TT Ms —p) (up) m—P)(m—p)- ©) 
15-1 k-1 Iel 
Wegen M(m;—p) = 0 verschwinden in dieser Summe alle Summanden, 
in denen wenigstens einer der Faktoren (x, —p) in erster Potenz auftritt. 
Demnach sind in dieser Summe nur die Summanden der Form M(u, — p)* 
und M(; — p)? (u, — p)* von Null verschieden. Es ist 


Mu—p)'=pq(p* +) 


Mu—P?(u—=pP (As. 

Die Anzahl der Summanden von der ersten Art ist gleich n, die Anzahl der 
Summanden der zweiten Art ist gleich 3n (na— 1); i kann nämlich mit j, k 
oder /zusammenfallen und dabei einen der n Werte von 1 bis n annehmen; 
s kann dagegen nur einen von n— 1 Werten annehmen (wegen s # Ü). 

Es ist also 


M(t— p} -Plnp® +9) +3pgm—n)]< 4; 


womit die Konvergenz der Reihe (8) nachgewiesen ist. Der Satz ist damit 
bewiesen. 

Der Satz von Bozk&u stellt den Ausgangspunkt einer bedeutenden Forschungs- 
richtung dar, die die Bedingungen untersucht, unter denen das sog. starke 
Gesetz der großen Zahlen erfüllt ist. 

Wir sagen, eine Folge von Zufallsgrößen 


Er Ep Er e » 


ist dem starken Gesetz der großen Zahlen unterworfen, wenn mit der Wahrschein- 
lichkeit Eins für n — 00 


und 


Eine sehr allgemeine und zugleich einfache hinreichende Bedingung für die 
Gültigkeit des Satzes der großen Zahlen liefert der folgende 


Satz von A. N. Kormocorors. Wenn eine Folge voneinander unabhängiger 
Zufallsgrößen &,, &, ... der Bedingung 


Rn < + oo 
n=1 
genügt, so ist sie dem starken Gesetz der großen Zahlen unterworfen. 
Zum Beweis verwenden wir einen Satz, der kürzlich von Hass und Rexyı 
aufgestellt wurde. Er stellt eine interessante Verallgemeinerung einer Un- 
gleichung von KoLMoGoROFF dar. 
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Ungleichung von HAszk — Ränyı. Wenn die gegenseitig unabhängigen 
Zufallsgrößen m, ng -.. endliche Dispersionen haben und Mn, =0 gilt und 
wenn die Konstanten c, positiv sind und nicht wachsen, so gilt für beliebige ganze 
Zahlen m und n (n > m) und beliebiges e > 0 


m n 
Pl maxcı m+tnN+ + nl >4<;(&3 Dn;+ > dDn). 


ms j=1 jem+i1 
Beweis. Wir betrachten die Größe 


n—1 
i= Z Mtrnt ta) tam + tm. 
=m 
Durch einfache Rechnungen kann man sich davon überzeugen, daß 


Me-chSDm+ B3 ‚Dr. 


k=m+ 


Wir betrachten die Ereignisse E,(=m,m-+1,...,n), die darin bestehen, 
daß 


mt +n|l<e für m<s<r 
und 

mt +nl2e. 
Das Ereignis 

max om + +ml2e 

m<kn 
bedeutet, daß bei mindestens einem k 

mt +nml>e 


gilt; es ist daher äquivalent mit dem Ereignis = E,. Wegen der Unverein- 
barkeitder E, gilt A 


P| max DESEETEnZ 3 P{E,}. 


m<k<n k=m 
Wir definieren noch das Ereignis E, durch 


mt +n|l<e fürm<s<n. 
Gemäß Gleichung (5), $ 26, ist 


M&= 5 M@IE,)- P(E,) + M@JE.)- P(E,) 


> & M(ZIE,) : P(E,) - (10) 


Weiter gilt offensichtlich für k > r 


NERTEENTERIEHERWERERERT 


z[(än] telnet] 


834. Das starke Gesetz der großen Zahlen 203 


Das Eintreten des Ereignisses E, bedeutet nur für die ersten r der Größen n; 
eine Beschränkung, und die folgenden bleiben unabhängig voneinander und 


r 
auch von %n, unabhängig; daher gilt für j>r 
s=1 


Mn &/z|= Mn M| Eunfe]=0 
und fürj>h>r 
M [n; nn/Er] = 0 . 


“(znj/2]> "(22/2 


Nach Definition des Ereignisses E, gilt 
länje]es 
s=1 cr 
Es ist aber 
n—1 k \ n 2 
M [E/E,] =2 M|( zu)fe] (£ u; + ı) + a “|( P} n) fe.) 
n—1 k 2 n 2 
>"ZM ( &) fe] d-dı)+g M|( &) fe] 


n—1 
MIE/EI => 3|. (E— Gr) + a ie, 


Wir finden somit 


und daher 


Die Ungleichung (10) liefert uns jetzt 


n 
Mi>2#®2P(E); 
. r=m 
dies aber war zu beweisen. 
In dem Spezialfalm=1,, =, = ---=,=1,1% = &— M£ı geht die 
Ungleichung von HAser-R£nvr in die Ungleichung von KoLMoOGOROFF über. 


Die Ungleichung von KoLmocororFr. Wenn die voneinander unabhängigen 
Zufallsgrößen &,&%,...,&, endliche Dispersionen besitzen, so ist die Wahr- 
scheinlichkeit des gleichzeitigen Eintretens der Ungleichungen 


E&—MB)|<e (kk=1,2,...,n) 
s=1 


nicht kleiner als 


1-4 Dh. 


k=1 
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Als weiteren Sonderfall der Ungleichung von Haser-Ränyı setzen wir 
1 


4=7: Dann ist 
n 
Dr 
p[ mex 4|$ ze <S— S, Om + m). 
(mer ii ei ie, LER Aue 


Hieraus erhalten wir ohne Mühe den Beweis des Satzes von KoLMoGoROFF. 
In der Tat finden wir fürn — oo 


Zulzict{a Son+, ZB) 


P {max 
s=l k=m+1 


k>m 


Wenn PN X konvergiert, so folgt aus der letzten Ungleichung 


Snja}-r 


lim P Imex 


m—> 00 k2m 


Dies ist äquivalent mit der Aussage 


=0) =1, 
Pf tim 4 m 2 er N 
und dies war zu beweisen. 


In dem bewiesenen Satz ist offenbar folgendes Resultat enthalten: 


Folgerung. Wenn die Dispersionen der Zufallsgrößen £, durch ein und die- 
selbe Konstante C beschränkt sind, so ist die Folge der voneinander unabhängigen 
Zufallsgrößen &,, &z &, ... . dem starken Gesetz der großen Zahlen unterworfen. 

Wir sehen also, daß das starke Gesetz der großen Zahlen nicht nur für das 
BernovuLtzische Schema mit einer konstanten Wahrscheinlichkeit für das Ein- 
treten eines Ereignisses A in jedem der Versuche gilt (Satz von BoREL), sondern 
auch im Falle des Poıssosschen Schemas, wo die Wahrscheinlichkeit des Er- 
eignisses A von der Nummer des Versuchs abhängt. 

Der bewiesene Satz gestattet es, als Folgerung ein abschließendes Resultat 
zu gewinnen, das auch von A. N. KoLMogoRorFrF stammt. 


Satz. Die Existenz der malhemalischen Erwartung ist eine notwendige und 
hinreichende Bedingung für die Anwendbarkeit des starken Gesetzes der großen 
Zahlen auf eine Folge gleichverteilter und paarweise unabhängiger Zufallsgrößen. 


Beweis. Aus der Existenz der mathematischen Erwartung folgt die Endlich- 
keit des Integrals [ |x| dF(x), wobei F(x) die Verteilungsfunktion der Zufalls- 
größen £, bezeichnet. 

Daher ist 


ZPil>n-Z „ErR<leI<K+N 


-ERPRk<I<SKH<Z J_, are) <Steldr@<@. (1) 


=0k<jalsk+ 
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Wir betrachten die Zufallsgrößen 


g _ Afürl<ae, 
"10 für |&|>n. 


Dann erhalten wir 


Det < Mer? = [dF@)< ED (k+ 1 P{k<|EI<K +1} 
—_n k=0 


und 
SıD = k+1 
DE < 3 SE rR<ii<k+) 
< IPÄR<EI<SK+ HN Y 4. 
k=0 n>k 
Da 


ist, so finden wir auf Grund von (11) 


PN <o, 


n=1 


d. h., die &} genügen dem starken Gesetz der großen Zahlen. 

Es bleibt also nur noch zu zeigen, daß damit der Satz bereits bewiesen ist. 
Dazu genügt es nachzuweisen, daß die Wahrscheinlichkeit wenigstens einer 
Ungleichung 


Er > 
fürn > N mit N — oo gegen Null strebt. In der Tat ist 
P {&, # &% für irgendein n > N} < yPf{&, + £&#} 

n>N ‘ 


= zPikl>n <En—N+ yPin<j&l<n+1} 


sEn [ dF@< < & f kldare)= S kldF@). 
n=N n<kel<n+ı nski<n+i1 klzN 

Auf Grund der Bedingung des Satzes läßt sich die rechte Seite dieser Ungleichung 

für hinreichend großes N kleiner als jede vorgegebene Zahl machen. 

Die prinzipielle Bedeutung des starken Gesetzes der großen Zahlen in der 
Wahrscheinlichkeitsrechnung und in ihren Anwendungen ist sehr groß. Nehmen 
wir nämlich für den Augenblick einmal an, daß, sagen wir im Falle gleich- 
verteilter Summanden, die einen endlichen Erwartungswert besitzen, das starke 
Gesetz nicht gelte. Dann kann man mit einer Wahrscheinlichkeit beliebig 
nahe an Eins behaupten, daß sich die Augenblicke wiederholen werden, in 
denen das arithmetische Mittel der Beobachtungsergebnisse weit vom Er- 
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wartungswert entfernt ist. Und dies würde selbst in solchen Fällen eintreten, 
wo die Beobachtung ohne systematischen Fehler und mit großer Genauigkeit 
durchgeführt würde. Könnte man unter diesen Bedingungen annehmen, daß 
das arithmetische Mittel aus den Beobachtungsergebnissen sich der zu mes- 
senden Größe annähert, dürften wir unter diesen Bedingungen annehmen, daß 
man das arithmetische Mittel als einen Näherungswert der zu messenden Größe 
ansehen kann? Das ist zweifelhaft. 


Übungen 
1. Man beweise: Existiert M e“* für eine Zufallsgröße & (a > 0, konstant), so ist 


Mess 
Pize}<s—. 


2. f{x) > 0 sei eine nicht abnehmende Funktion. Man beweise: Existiert M fle —ME£ )) 
Bo ist 
MftlE—M El) 
f(&) " 


3. Eine Folge unabhängiger und gleichverteilter Zufallsgrößen {£,} werde durch die 
Gleichungen 


P{E—Mil>e< 


a) Pf&, = 2n—logn—2loglogn) — = (k=1,2,3,...)» 


© 
b) PiE= = ann (v2: - Ir) 
definiert. Man beweise, daß auf diese Folgen das Gesetz der großen Zahlen anwendbar ist. 
4. Man beweise, daß auf die Folge der unabhängigen Zufallsgrößen {£n}; 
Plu=n)=-Pln=—n)= 2 
das Gesetz der großen Zahlen dann und nur dann anwendbar ist, wenn & < 3 ist. 


5. Man beweise: Gilt für unabhängige Zufallsgrößen &,, &, ---;&4,-.. die Beziehung 


max S el dr) >0Ofür 4 —o, 
ı<k<n el24A 
so ist auf die Folge {£,} das Gesetz der großen Zahlen anwendbar. 
Hinweis: Man benutze die beim Beweis des Satzes von CHINTSCHIN angewandte 
Methode. 


6. Unter Benutzung des Ergebnisses der vorigen Aufgabe beweise man: Gibt es für eine 
Folge unabhängiger Zufallsgrößen {£&,} solche Zahlen «> 1 und ß, daß M |&,|*<P, 
so ist auf die Folge {£„} das Gesetz der großen Zahlen anwendbar (Satz von A. A. 
MARKoWw). 


7. Gegeben sei eine Folge von Zufallsgrößen &,,&,... mit den Eigenschaften Di, < C 
und R;;—> 0 für | — 7] — © (R;; ist das Korrelationskoeffizient zwischen &; und £;). 
Man beweise, daß auf diese Folge das Gesetz der großen Zahlen anwendbar ist (Satz 
von S.N. BERNSTEIRN). 


VII. 


CHARAKTERISTISCHE FUNKTIONEN 


Wir sahen in den früheren Kapiteln, daß in der Wahrscheinlichkeitsrechnung 
die Methoden und der Rechenapparat ganz verschiedener Gebiete der Analysis 
weitgehend benutzt werden. Eine einfache Lösung sehr vieler Aufgaben der 
Wahrscheinlichkeitsrechnung, besonders derer, die mit der Summierung 
unabhängiger Zufallsgrößen zusammenhängen, gelingt mit Hilfe der charak- 
teristischen Funktionen. Die Theorie dieser Funktionen ist in der Analysis 
entwickelt und unter dem Namen FourıEr-Transformationen bekannt. 
Das vorliegende Kapitel ist der Darlegung der Grundeigenschaften der charak- 
teristischen Funktionen gewidmet. 
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Unter der charakteristischen Funktion einer Zufallsgröße & versteht man die 
mathematische Erwartung der Zufallsgröße e'*.1) Ist F(x) die Verteilungs- 
funktion der Größe £, so ist die charakteristische Funktion nach Satz 1, $27 


gleich 
Io = fe" dF@). (1) 

Wir verabreden für das folgende, die charakteristische Funktion und die ihr 
entsprechende Verteilungsfunktion mit ein und demselben Buchstaben zu be- 
zeichnen, wobei wir für die charakteristische Funktion kleine, für die Vertei- 
lungsfunktion große Buchstaben wählen. 

Für reelle £ ist |e''=] = 1 ; daher existiert das Integral (1) für alle Verteilungs- 
funktionen; folglich läßt sich zu jeder Zufallsgröße eine charakteristische Funk- 
tion bestimmen. 


Satz 1. Eine charakteristische Funktion ist auf der ganzen reellen Achse 
gleichmäßig stelig und genügt den folgenden Beziehungen: 
Q)=1, folsi -w<t<o). (2) 
Beweis. Die Beziehungen (2) ergeben sich unmittelbar aus der Definition 
der charakteristischen Funktion. Nach (1) ist nämlich 
f0)=f1-dF@a)=1 
1) t ist ein reeller Parameter. Die mathematische Erwartung einer komplexen Zufalls- 


größe £ + in definiert man als ME+:iMn. Man prüft leicht nach, daß die Sätze 1, 2 
und 3, $28, auch in diesem Fall richtig sind. 
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und 
Yo] = |f e* ar@)| < fe) dF@)=1. 


Es bleibt nur noch die gleichmäßige Stetigkeit der Funktion /(f) zu beweisen. 
Dazu betrachten wir die Differenz 


ft +1 —f) = fe” (€ — 1) dF(e) 
und schätzen ihren Betrag ab. Wir erhalten: 
VE+mMd—iOl<f je —i[dF(e). 


Es sei nun & eine beliebig vorgegebene positive Zahl; wir wählen ein A so groß, 
daß 


dF(x) < z 
DER 
ist und wählen A so klein, daß für |x| < A 


” h >: 
je'* 1| < > 
gilt. Dann ist 
4 
Kt+m9— Ol < Se” —1ldF@) +2 f dF@W)<e. 
—4 124 
Diese Ungleichung beweist unseren Satz. 
Satz 2. Ist die Zufallsgröße n durchn = a& + b mit den Konstanten a und b 
gegeben, so ist 
DO = Idad) et; 
fd und fs(l) bezeichnen hier die charakteristischen Funktionen der Größen n 
und £. 
Der Beweis ist trivial, denn es gilt 
IA) — Met — Meitli+tb) _ gitb Meitat _ gitd «(a i) ! 


Satz 3. Die charakteristische Funktion der Summe zweier unabhängiger Zu- 
fallsgrößen ist gleich dem Produkt ihrer charakteristischen Funktionen. 


Beweis. Es seien £ und 7 unabhängige Zufallsgrößen, undessiö=€-+n. 
Dann ist es evident, daß mit & und y auch die Zufallsgrößen e* und e*'” un- 
abhängig sind. Hieraus ergibt sich die Gleichung 


Meiti— Meitt+n = Mettetn — Me!! Melt", 
womit unser Satz bewiesen ist. 


Folgerung. Ist 
F=htht + 
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und jeder Summand unabhängig von der Summe der vorhergehenden, so ist die 
charakteristische Funktion der Größe & gleich dem Produkt der charakteristischen 
Funktionen der Summanden. 

Bei der Anwendung der charakteristischen Funktionen kommt in bedeuten- 
dem Maße die in Satz 3 formulierte Eigenschaft zum Tragen. Die Addition 
unabhängiger Zufallsgrößen führt — wie wir in $24 sahen — zu einer sehr 
komplizierten Operation — der Faltung der Verteilungsfunktionen der Sum- 
manden. Für die charakteristischen Funktionen läßt sich diese komplizierte 
Operation durch eine sehr einfache — nämlich die Multiplikation der charak- 
teristischen Funktionen — ersetzen. 


Satz 4. Besitzf eine Zujfallsgröße & ein absolutes Moment n-ter Ordnung, so 
ist die charakteristische Funktion der Größe & n-mal differenzierbar, und für 
k<nist 

X) = iM. (8) 


Beweis. Die k-malige (k < n) formale Differentiation der charakteristischen 
Funktion führt uns auf die Gleichung 


PH = fat e!*dFle). (4) 
Nun gilt aber 
a eizar@) </Iefarß), 


und daher ist auf Grund der Voraussetzung unseres Satzes die linke Seite dieser 
Ungleichung beschränkt. Hieraus folgen die Existenz des Integrals (4) und die 
Rechtfertigung für die durchgeführte Differentiation. Setzen wir in ()ti=0, 
so finden wir 


fo) = if a® dF@). 


Die mathematische Erwartung und die Dispersion lassen sich sehr einfach 


mit Hilfe der Ableitungen des Logarithmus der charakteristischen Funktionen 
ausdrücken. Setzen wir 


ve) = log fl), 
dann ist 
[9 
iv) 
” re) — FOR 
= [0 
vl) "rn i 


Wenn wir beachten, daß f(0) =1 ist, so finden wir unter Berücksichtigung 
der Gleichung (3) 


und 


v()=f()=iM& 
und 


vo) = FO —-FOP=EMAR—TME?=—DE. 
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Hieraus gewinnen wir die Beziehungen 
I 
M£i= z» (0) 


und (5) 
Di=— y’(0). 


Die k-te Ableitung des Logarithmus der charakteristischen Funktion im: 
Punkt 0, multipliziert mit i*, heißt die Semiinvariante k-ter Ordnung der Zufalls- 
größe. 

Aus Satz 3 folgt unmittelbar, daß sich bei der Addition unabhängiger Zu- 
fallsgrößen ihre Semiinvarianten addieren. 

Wir sahen eben, daß die ersten beiden Semiinvarianten die mathematische 
Erwartung und die Dispersion sind, d. h. ein Moment erster Ordnung und eine 
rationale Funktion der Momente der ersten und zweiten Ordnung. Durch Aus- 
rechnung überzeugt man sich leicht davon, daß die Semiinvariante einer be- 
liebigen Ordnung X eine (ganze) rationale Funktion der ersten k Momente ist. 
Als Beispiel führen wir die expliziten Ausdrücke der Semiinvarianten dritter 
und vierter Ordnung an: 


89’) = —{M®—3M&. ME+2[MEP}, 
it pV0)= M&—4 ME ME—3[M2P +12 MEITMEP—6[MER. 
Wir betrachten nun einige Beispiele von charakteristischen Funktionen. 


Beispiel 1. Eine Zufalisgröße & sei nach dem Normalgesetz mit der mathe- 
matischen Erwartung a und der Dispersion o? verteilt. Die charakteristische 
Funktion der Größe £ ist gleich 


a _ ee 
We Fa. 
oy2r 


_ Die Substitution 


zit —ito 
führt g(f) in 
w—iio 2 
sat = 
e)=e RM e ®dz | 
y2* 
— 0—ilo 


o—ia 


ist, folglich ist 
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Unter Benutzung von Satz 4 rechnet man mühelos die Zentralmomente 
der Normalverteilung aus und kommt so auf ganz anderem Wege zum Ergebnis 
des in $30 betrachteten Beispiels. 

Beispiel 2. Gesucht ist die charakteristische Funktion einer nach dem 
Poıssoxschen Gesetz verteilten Zufallsgröße £. 

Nach Voraussetzung nimmt die Größe & nur ganzzahlige Werte an. Es ist 


Akea—ı 
P£=kK= z k=0,1,2,...) 
(A > 0 ist dabei konstant). 
Die charakteristische Funktion der Größe & ist gleich 


on L:) 
: . „5A 
ft) = Met! = Dr P{& — k} Er Deut na 
k=0 k=0 k! 

] 
er SR rat _ aellmı 
=e EDEN ), 

Nach (5) gewinnen wir hieraus 


ME=2y0)=4, Di=—y'0)=4. 


Die erste dieser Gleichungen hatten wir schon früher ($ 26, Beispiel 3) direkt 
erhalten. 


Beispiel 3. Eine Zufallsgröße £ sei im Intervall (— a, a) gleichmäßig ver- 
teilt. Die charakteristische Funktion ist gleich 


Id u ne 


at 


Beispiel 4. Gesucht ist die charakteristische Funktion der Größe u, die 
gleich der Anzahl des Eintretens eines Ereignisses A in n unabhängigen Ver- 
suchen ist. Die Wahrscheinlichkeit für das Eintreten des Ereignisses A sei 
bei jedem Versuch gleich p. 

Die Größe u läßt sich als Summe 

KA=lhtlatt tm 
von n unabhängigen Zufallsgrößen darstellen, von denen jede nur die beiden 
Werte 0 und 1 beziehungsweise mit den Wahrscheinlichkeiten g = 1— p undp 
annehmen kann. Die Größe u, nimmt den Wert 1 an, wenn das Ereignis A 
im k-ten Versuch eintritt, und wird gleich 0, wenn das Ereignis A im k-ten 
Versuch nicht eintritt. 
Die charakteristische Funktion der Größe u; ist gleich 
MO = Met = et tg +etip=g+pe". 
Nach Satz 3 ist die charakteristische Funktion der Größe u gleich 


10 = KARO) =(q+peyr. 


15 Gnedenko 
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Wir bestimmen nun noch die charakteristische Funktion der Größen -!—t? 


Nach Satz 2 ist sie gleich npq 


I) = rl) Nr (o +p Tem) 
1; VE Pr Vs) 


Beispiel 5. Die charakteristischen Funktionen genügen der Gleichung 


k—9 =. 
In-der Tat ist ja 


fd = Se dr) = [ et= dr) = fd. 


$ 36. Umkehrformel und Eindeutigkeitssatz 

Wir sahen, daß man zu der Verteilungsfunktion einer jeden Zufallsgröße & 
stets eine charakteristische Funktion finden kann; für uns ist es wichtig, daß 
auch die umgekehrte Behauptung richtig ist: Durch die Vorgabe der charak- 
teristischen Funktion ist die Verteilungsfunktion eindeutig bestimmt. 

Satz 1. Es seien f(l) und F(x) die charakteristische Funktion und die Ver- 
teilungsfunktion einer Zufallsgröße &. Sind x, und x, Stetigkeitsstellen der Funk- 
tion F(x), so ist 


Fo) — F@,) = zlim J er gar. a) 


Beweis. Aus der Definition der charakteristischen Funktionen folgt, daß 
das Integral 
1 er dm — Bu 


m 
gleich 
=, | j lete—m — ete—=0] dF(e) di 
—c 


ist. Hier kann man die Reihenfolge der Integrationen vertauschen, da bezüg- 
lich z das Integral absolut konvergiert und bezüglich ! die Integrationsgrenzen 
endlich sind. Auf diese Weise erhalten wir 


=] h j Bez al are) 


-[ I} [ee e-ite—a) — eit@—a) + e-ite—n) 
4 


a) dF(z) 


Le Ies>- = latare). 
n 
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Nun weiß man aus der Analysis, daß für c — oo 


1 


7 wenn «>0, 


[4 
1 [sinat 
ea ® 


— wenna<0. 


Diese Konvergenz ist gleichmäßig bezüglich « in jedem Gebiet «>öd>0 
(bzw. a < — 8) und für |a| < ö ist für alle c 


c 
„ja BR 
EL} t 

ö 


Wir wollen nun den Fall annehmen, daß x, > x, ist, und zerlegen das Inte- 
gral J, in die Summe 


(8) 


5 406 ns + 


J=-/+J+7 +I,+ [ve 2; 2, 2) dF(z) ; 


-o m—5 nt 96 
dabei ist zur Abkürzung 


van, | m nr ae 
0 


gesetzt und ö > 0 so gewählt, dB, +65 <, — dist. 


Im Gebiet — oo <z<2,— ö bestehen die Ungleichungen 2—  <— 6 
und 2— 2% <—ö. Auf Grund von (2) schließen wir daher, daß für c — 00 


u—6 
S 9 & 2; 2, 2,) dF(e) >0 
oo 
strebt. Analog gilt für zz, +5 <z< + oound ce — oodie Beziehung 
oo 
Sy 2; 2,2%) dF(e) —0. 
+8 


Da im Gebiet  +5<z<m,—ö die Ungleichungn z—x,>dö und 
z— 2, <ö gelten, so ist ferner nach (2) für c — oo 


6 
„Jre3m 2) dr) > = T, AFC) = Fin — 8) — Fa, + 8). 
Nach (3) können wir schließlich ak Abschätzungen benutzen: 


2.) dF(z) 


+6 
<2 ] dr@) = 2 [FG +) — Fl — 0] 


und 
+6 


By Y (6 2; 2,2%) dF(z) 


<2 7, FC) = 2 [Fl +9) — Fy—8)]. 


15* 
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Auf diese Weise finden wir bei beliebigen ö > 0 die Beziehungen 
lim J, = F(x, — 6) — F(x, + 6) + Rı(ö, 2, %;) 


c—>% 
und 
lim I, = Fix — 8) — F(a, + 8) + Rad, 2,2), 
1>o 
dabei gilt die Ungleichung 
[Rd 2 2)| < {Fl + 8) — Fin — 6) + Fly + 8) — Fi — 8)} 
((=1,2). 
Nun strebe ö gegen 0. Da x, und 2, Stetigkeitsstellen der Funktion F(x) 
sind, ergeben sich hieraus die Gleichungen 
lim F(x, + 6) = lim F(x, — 6) = F(x,) 
d>0 0 
und 
lim F(x, + 6) = lim F(x, — 6) = F(&,) . 
50 


6—>0 
Da J, nicht von ö abhängt, ist 


lim J, = F(&,) — F(z)). 


Die Gleichung (1) nennt man die Umkehrformel. Wir benutzen diese Formel 
zur Ableitung des folgenden wichtigen Satzes (des Eindeutigkeitssatzes). 

Satz 2. Die Verteilungsfunktion ist durch ihre charakteristische Funktion 
eindeutig bestimmt. 


Beweis. Aus Satz 1 folgt in der Tat unmittelbar, daß an jeder Stetigkeits- 
stelle der Funktion F(x) die Formel 


+e 
SE : e-ity — e-itz 
a N el 
—t 
gilt; der Limes bezüglich y wird dabei über die Menge der y genommen, die 
Stetigkeitsstellen der Funktion F(r) sind. 
Als Anwendung des letzten Satzes beweisen wir die folgenden Aussagen. 


Beispiel 1. Wenn die unabhängigen Zufallsgrößen &, und &, normal ver- 
teilt sind, so ist ihre Summe £ = &, + &, ebenfalls normal verteilt. 
Ist nämlich 
M&=a,D&=0); M&,=4,D&,=0, 
so sind die charakteristischen Funktionen der Größen £&, und £, gleich, 


ln int loln 


kO=e" 3, et 
Nach Satz 3, $ 35, ist die charakteristische Funktion f(£) der Summe gleich 


IO = hd I) = erg hrehe 
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Dies ist die charakteristische Funktion des Normalgesetzes mit der mathe- 
matischen Erwartung a=a,+ a, und der Dispersion = +0. Auf 
Grund des Eindeutigkeitssatzes schließen wir hieraus, daß die Verteilungs- 
funktion der Größe & normal ist. 

Der umgekehrte, von H. CRAMER bewiesene Satz, den wir in $ 24 formulierten, 
läßt sich mit Hilfe der charakteristischen Funktionen folgendermaßen formu- 
lieren: Sind f,(f) und f;(f) charakteristische Funktionen und ist 


e 
hd hd = e ®, 
so ist 


5 % p 
[7 a Fa 7 PT 0<0<1). 


Beispiel 2. Die unabhängigen Zufallsgrößen &, und £&, seien nach dem 
Poıssoxschen Gesetz verteilt; es sei 


RR ERS ze 


Ak e7 id, 
ki’ Tas 


P{a=k= E 


Wir beweisen, daß die Zufallsgrößen & = &, + &, nach dem Poıssonschen Ge- 
setz mit dem Parameter A = A, + A, verteilt ist. 

Im Beispiel 2 des vorigen Paragraphen sahen wir, daß die charakteristischen 
Funktionen der Zufallsgrößen £&, und &, gleich 


=, = 


sind. Nach Satz 3 des vorigen Paragraphen ist die charakteristische Funktion 
der Summe & = &, + &, gleich 


10 = Oh) = rw, 


d.h. charakteristische Funktion eines Poıssonschen Gesetzes. Nach dem 
Eindeutigkeitssatz ist die einzige Verteilung, die /(t) als charakteristische Funk- 
tion besitzt, das Poıssonsche Gesetz mit 
Ati 
Pg=n- Ati. 
kt 
D.A. Rııkow bewies den umgekehrten tiefer liegenden Satz: Wenn die 
Summe zweier unabhängiger Zufallsgrößen nach dem Poıssonschen Gesetz 
verteilt ist, so ist jeder Summand ebenfalls nach dem Poıssoxschen Gesetz 
verteilt. 


Beispiel 3. Die charakteristische Funktion ist dann und nur dann reell, 
wenn ihre zugehörige Verteilungsfunktion symmetrisch ist, d.h., wenn für 
beliebige x die Verteilungsfunktion der Gleichung 

Fa) =1— F(-:+0) 
genügt. 
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Wenn die Verteilungsfunktion symmetrisch ist, so ist ihre charakteristische 
Funktion reell. Dies beweist man durch einfaches Nachrechnen: 
Io) = f e'* dF(«) 
x oo 
= —fet* dF(— 2 +0) + [ex dF(x) + F(+0)— F(—0) 
ö h) 


oo 


= f{eit® + dt2)dF@) + F+ 0) — 0) 
ö 
=2 feos tz dF(&) + F(+ 0) — F(—0) = fceostzdF(e). 
0 


(Wir erinnern hier daran, daß wir die untere Grenze in das Integrationsintervall 
einbeziehen und die obere Grenze ausschließen wollten.) 

Zum Beweis der Umkehrung betrachten wir die Zufallsgröße n = —£. Die 
Verteilungsfunktion der Größe 7 ist gleich 


Ga) =Pfn<a}=Pff>—a}=1—F(-2+0). 


Die charakteristischen Funktionen der Größen £ und 7 hängen durch die Be- 
ziehung u 
g) = Met = Merit!= Met <= fl) 


miteinander zusammen. Da nach Voraussetzung f{f) reell ist, ist fd) = f{t) und 


somit 
= fh. 


Aus dem Eindeutigkeitssatz schließen wir nun, daß die Verteilungsfunktionen 
der Größen £ und n übereinstimmen, d. h., daß 
Fa) =1— F(— x +0) 
ist, q.e.d. 
Wir bringen hier noch den Beweis der folgenden Tatsache. 


Satz 3. Wenn die charakteristische Funktion ff{l) integrierbar über die ganze 
Achse ist, so ist die ihr entsprechende Verlteilungsfunktion F(x) absolut stetig, ihre 
Ableitung p(x) ist stelig, und es gili 


pa) = Fa) =,- j eritz io) di. 


Beweis. Wenn die Funktion ff) über die ganze Achse integrierbar ist, so 
—t —eo-i 
hat auch die Funktion mn f() diese Eigenschaft; daher läßt sich 


die Umkehrformel in der folgenden Weise schreiben 
oo 
1 ein — e-iim 
F@) — Fa) = Pp —ıaH 1% dt. 


—o© 
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Wir wählen jetzt h so, daß, =r— hund =r+ Äh Stetigkeitspunkte von 
F(x) sind. Nach leichten Umformungen gelangen wir zu der Gleichung 


F@+h—F@—h) =2h- [rc roa. (4) 


—— 


Wegen <list 


Fa+h—Fa@—h)<2h.2- [woiar. 


Diese Ungleichung liefert beim Grenzübergang h—0 
Fix +0) — Fe —0)=0. 
Daher ist F(x) absolut stetig. Jetzt können wir (4) in der Form 


Fe+h—Fe—h) _ 1 [sin th m 


schreiben. Da der Integrand bei R—0 gegen e*'* f(f) strebt, gilt nach dem 
bekannten Satz von LEBESGUR 


lm fen ER 


© 
it 
im. [eiwa-z, [end 
—co —o 
Hiernach existiert der Limes der rechten Seite der Gleichung (5); es muß also 
auch der Limes der linken Seite vorhanden sein. Daher gilt bei jedem Wert 
von x 


© 
Be Fae+h)—Fa—h) _ 1 u 
Pl) = lim III ee. 
Aus obigen Rechnungen folgt nun 
1 f e 
[pie + pol <z | sin“p|ingl ar. 


Um das Integral auf der rechten Seite abzuschätzen, schreiben wir es in Form 
folgender Summe 
th| 


1 
= [ sin >| old +  [ 
<A Au SA 
Es sei e > 0 vorgegeben; dann läßt sich A so wählen, daß 


Old<z- 
kl>4A 
Das Integral über das Intervall {| < A kann durch Wahl eines genügend kleinen 


h kleiner als z gemacht werden. Damit ist der Satz vollständig bewiesen. 


sin‘ == :| io) dt 
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$ 37. Die Sätze von HELLY 


Für das Folgende benötigen wir zwei rein analytische Sätze — den ersten 
und den zweiten Satz von HELLY. 
Wir wollen sagen, eine Folge nicht abnehmender Funktionen 
F,(&), Fx(&), . . . » Fu(&), - . - 


konvergiere im wesentlichen gegen eine nicht abnehmende Funktion F(rt), wenn 
sie für n — oo gegen letztere an jeder Stetigkeitsstelle konvergiert. 
Im weiteren wollen wir stets annehmen, daß die Funktionen F,(x) der 
zusätzlichen Bedingung 
F,— x) = 0 


genügen, und werden dies nicht mehr besonders hervorheben. 

Wir bemerken sofort, daß es für die Konvergenz im wesentlichen hinreichend 
ist, daß die Funktionenfolge auf einer überall dichten Menge D gegen die 
Funktion F(x) konvergiert. Es sei x ein beliebiger Punkt, und x’ und x” seien 
irgend zwei Punkte der Menge Dmit! <r<r”. Dann gilt 

Ful‘) < Falk) < Fu") , 
folglich ist 


lim F,(') < lim F,(x) < lim F,(«) < lim F(@”).. 
n> oo 2>© >00 no 
Da aber nach Voraussetzung 


lim F,(@)=F() und lim F,(@”) = F(e”) 
2080 n>+X0 


gilt, so ist auch 
F(@') < lim F,(z) < lim F,(@) < F@”). 
eg n—X0 


no 


Die mittleren Glieder in diesen Ungleichungen hängen aber nicht von x’ und 
x' ab, daher ist 


F(@— 0) < lim F,(«) < lim Fy() < Fe + 0). 


Wenn die Funktion F(x) im Punkt x stetig ist, so ist 
F(x —0)=F(@)=F(e +0). 
Somit ist an allen Stetigkeitsstelllen der Funktion F(«) 
lim F,(&) = F(@) . 
n>% 
Erster Satz von Hrıny. Jede Folge von gleichmäßig beschränkten, nicht 
abnehmenden Funktionen 
F,@), Fy@), a ; F,(&), ae (1) 
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enthält wenigstens eine Teilfolge 
Fu@), F®, «+» Fn,@),- 
die im wesentlichen gegen eine gewisse nicht abnehmende Funktion F(x) konvergiert. 


Beweis. D sei irgendeine abzählbare überall dichte Punktmenge x), 23, .. 
a». Wir bilden die Werte der Funktionen (1) im Punkt z;: 


Fl), Fa), .. ., F@).... 


Da die Menge dieser Werte nach Voraussetzung beschränkt ist, so enthält sie 
wenigstens eine Teilfolge 


Fy(&ı), Fl), de Fın&ı), u..,;. (2) 
die gegen einen gewissen Grenzwert G(xj) konvergiert. Wir betrachten nun 
die Menge der Zahlen 

Flo), Faalt2), - - -» Fınlaa) . .- - 


Da auch diese Menge beschränkt ist, so existiert in ihr eine Teilfolge, die gegen 
einen Grenzwert G(x,) konvergiert. Wir können also aus der Folge (2) eine 


Folge 
Fa(X), Fol), - - -» Fonl®), - - - (3) 
auswählen, für die gleichzeitig lim F,„(x;) = G(x}) und lim F3„(23) = G(x;) ist. 
Diese Auswahl von Teilfolgen ” — 

Fu@), Fl), , F,@---» (4) 
für die gleichzeitig die Gleichungen Ju F +) = G(z,) für alle r<k gelten, 
setzen wir weiter fort. Wir bilden nun die Diagonalfolge 

Fu) Fa)... Fr) --- - (5) 
Als Teilfolge von (2) gilt für sie die Beziehung ‚m 1 Funlaı) =G(x;). Da 


die ganze Diagonalfolge nur mit Ausnahme des ersten Gliedes aus der Folge (3) 
ausgewählt war, gilt wur Ian Fun) = G(z5). Allgemein ist die ganze 


Diagonalfolge bis auf die k — -T: ersten Glieder der Folge (4) entnommen; daher 
gilt für sie für jedes k die Beziehung" Im: Fyun(%) = G(x;). Das gewonnene 


Resultat läßt sich folgendermaßen formulieren: Die Folge () enthält wenigstens 
eine Teilfolge, die in allen Punkten x; der Menge D gegen eine auf der Menge D 
definierte Funktion G(x) konvergiert. Da die Funktionen F,„,„(x) nicht ab- 
nehmen und gleichmäßig beschränkt sind, ist offensichtlich auch die Funk- 
tion G(x) nicht abnehmend und beschränkt. 

Es ist dann klar, daß man die auf der Menge D definierte Funktion G(x) 
so fortsetzen kann, daß sie auf der ganzen Geraden — oo < 2. < 00 definiert 
ist und dabei beschränkt und nicht abnehmend bleibt. 
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Die Folge (5) konvergiertgegen diese Funktion auf der überall dichten 
Menge D; folglich konvergiert sie im wesentlichen gegen sie. Dies war gerade 
zu zeigen. Wir bemerken, daß die durch Fortsetzung der Funktion G gewonnene 
Funktion nicht linksseitig stetig zu sein braucht. Wir können jedoch ihre 
Werte in den Unstetigkeitsstellen so abändern, daß die Funktion diese Eigen- 
schaft erhält. Die Teilfolge F„„ Konvergiert im wesentlichen auch gegen die 
so „korrigierte“ Funktion. 


Zweiter Satz von Heııy. f(x) sei eine stelige Funktion; die Folge 
F,(&), Fol), - . - , Fr(&), . - - 


nicht abnehmender, gleichmäßig beschränkter Funktionen konvergiere im wesent- 
lichen gegen die Funktion F(x) auf dem endlichen Intervalla<xz<b; a undb 
seien Stetigkeitsstellen der Funktion F(x); dann gilt die Gleichung 


Kim HOLZOE f f@) dF@) . 


Beweis. Aus der Stetigkeit der Funktion f(x) folgt, daß man zu jedem 
noch so kleinen positiven konstanten e eine Einteilung des Intervall a <r<b 
durch die Punkte ,=4,2%,...,2y=b in die Teilintervalle (x;, 2,41) so 
finden kann, daß in jedem Intervall (z;, z,,1) die Ungleichung |f{z) — f(z)| < & 
erfüllt ist. Unter Benutzung dieses Tatbestandes können wir eine Hilfsfunk- 
tion f,(x) einführen, die nur endlich viele Werte annimmt: 

K)=Na) für. <e<z;ı- 
Offenbar ist für alle x im Intervalla < x < b die Ungleichung 
IM) — F@)| <e 
erfüllt. Dabei können wir von vornherein die Teilpunkte 2,2,...,2y_ı 
so wählen, daß sie Stetigkeitsstellen der Funktion F(xz) sind. Auf Grund der 


Konvergenz der Funktionen F,(z), Fx(z),... gegen die Funktion F(x) sind 
für hinreichend große n in allen Teilpunkten die Ungleichungen 


IF) — Faa)| < gr (6) 
erfüllt; M bezeichnet dabei die Größe max |/(z)| . 
a<ı<b 


Ohne weiteres ist klar, daß 


b 
f @) dFCe) — | I) AF,e) 


d b 
< | J f@) dF(x) —) f«(&) dF(x) 


+ | f Ile) AP) — [ Ike) dFsa)| + | f 1a) dr.) — f f(x) dF,a) 


ist. Man rechnet leicht nach, daß die Größe des ersten Summanden auf der 
rechten Seite nicht e [F(b) — F(a)] und die des dritten nicht e [F„(b) — F„(a)] 
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übertrifft. Der zweite Summand ist gleich 


N— N—ı 
ZN [Red — Flea] — 2, nl) — Frl) 


N—ı n—ı 
z „w [Fr +1) — Fa&+1)] = 2 Mr) [F(&) — Fr(&)] 


für genügend große n wird er also nicht größer als 2 e, wie man aus der 
Ungleichung (6) ersieht. Auf Grund der gleichmäßigen Beschränktheit der 
Funktionen F'„(x) läßt sich die Summe 

e [F(b) — F(a)] + & [F„(6) — Fu(a)] + 2 
mit e beliebig klein machen. 

Der verallgemeinerte zweite Satz von Heııy. Wenn die Funk- 
tion f(x) auf der ganzen Geraden — &< x < oo stelig und beschränkt ist, und 
die Folge gleichmäßig beschränkter nicht abnehmender Funktionen 

F,(&), F&), - - ., Frl), - - - 
im wesentlichen gegen die Funktion F(x) konvergiert und wenn 


lim F„(— oo) = F(— oo), lim F„(+ oo) = F(+ oo) 


nn 600 


ist, so gilt die Gleichung 
„Jim f Ma) dF,(2) = [ ix) dF@). 


Beweis. Essei A <O und B> 0; wir setzen 


1 =| [no ar) — [Ro ar) 


’ 


B 
ı= | Ste ar) — no ar.@) 


es | So ar) — Fre) ar.) 


Offenbar ist 
IS Ha) dFle) — f Ka) AFsa)| <A + + da: 


Die Größen J, und J, kann man beliebig klein machen, wenn man nur A 
und B dem Betrag nach genügend groß macht, es so einrichtet, daß A und B 
Stetigkeitsstellen der Funktion F(x) sind und n genügend groß wählt. Sei 
nämlich M= sup |f(«)| ; dann ist 

z<o 


i Jı < MIF(A) + Fr(4)], 
Js < M[F(+ ©) — F(B)] + M[Fs(+ 00) — F(B)]. 
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Nun ist aber 
lim F(A)=0, lim F(B) = F(+o). 
4>—o B>o 


Da nach Voraussetzung 
lim F„(A) = F(A), lim F„(B) = F(B) 
n>% n>%X0 


ist, ist unsere Behauptung über J, und J; bewiesen. Die Größe J, läßt sich 
für hinreichend großes n auf Grund des Heıryschen Satzes für ein endliches 
Intervall beliebig klein machen. 

Der Satz ist damit bewiesen. 


$ 38. Grenzwertsätze für charakteristische Funktionen 


Für die Anwendung der charakteristischen Funktionen auf die Ableitung 
asymptotischer Formeln der Wahrscheinlichkeitsrechnung sind zwei Grenz- 
wertsätze äußerst wichtig, ein direkter und dessen Umkehrung. Diese Sätze 
sagen aus, daß die zwischen den Verteilungsfunktionen und den charakteristi- 
schen Funktionen bestehende Zuordnung nicht nur eindeutig, sondern sogar 
stetig ist. 

Der direkte Grenzwertsatz. Wenn die Folge von Verteilungsfunktionen 

F(&), Fra), ..., Frl)». » 


im wesentlichen gegen die Verteilungsfunktion F(x) konvergiert, so konvergiert 
die Folge der entsprechenden charakteristischen Funktionen 


hd, Id, Ba IAOR ... 


gegen die charakteristische Funktion fft) von F(x). Diese Konvergenz ist in jedem 
endlichen Intervall gleichmäßig. 


Beweis. Da 
In) = fe" dF,(@), MO= Se" dFla) 
ist und die Funktion e''* auf der ganzen Geraden — 00o< << oo stetig und 
beschränkt ist, gilt nach dem verallgemeinerten zweiten Hzıyschen Satz für 


n— 
I) >10. 
Die Behauptung, daß diese Konvergenz in jedem endlichen Intervall gleich- 
mäßig, ist, läßt sich wörtlich mit denselben Überlegungen nachprüfen, wie sie 
beim Beweis des zweiten Hrryschen Satzes durchgeführt wurden. 


Umkehrung des direkten Grenzwertsatzes. Wenn die Folge der 
charakteristischen Funktionen 


AO ds.» nd» » - (1) 


gegen eine stetige Funktion f(f) konvergiert, so konvergiert die Folge der entsprechen- 
den Verteilungsfunktionen 


Fı(@&), Fi(@), - .. , Fa)... (2) 
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im wesentlichen gegen eine gewisse Verteilungsfunktion F(x) (auf Grund des 
direkten Grenzwertsatzes ist f(t) = f e'* dF(x)). 


Beweis. Auf Grund des ersten Heryschen Satzes schließen wir, daß die 
Folge (2) eine Teilfolge 
Fu, @), Fn,(@): ee F,,(@&) asya (3) 


enthalten muß, die im wesentlichen gegen eine nicht abnehmende Funktion F(x) 
konvergiert. Dabei versteht es sich, daß man die Funktion F(x) als linksseitig 
stetig annehmen kann: 
lim F(«’) = F(x). 
2’—>2—0 
Im allgemeinen braucht die Funktion F(x) keine Verteilungsfunktion zu sein, da 
dazu noch die Bedingungen F(— oo) = 0 und F(+ ©) = 1 erfüllt sein müßten. 
Für die Folge 
0 fü son, 


Fa) =15 für—n<a<n, 
1 für z>n, 


1 
z. B. ist die Limesfunktion F(x) = 37» folglich sind F(— oo) und F(-+ oo) beide 
gleich —. Unter den Bedingungen unseres Satzes ist jedoch — wie sofort 


gezeigt wird — F(— oo) = 0 und F(+ mx) =1. 

Wäre dies nämlich nicht der Fall, so hätten wir — wenn wir beachten, daß 
für die Limesfunktion unbedingt F(— oo) > 0 und F(+ oo) <1 sein muß — 
die Ungleichung 

ö6=F(+o)— F-m)<1. 


Wir nehmen nun irgendeine positive Zahl e, die kleiner als 1—öist. Da nach 
Voraussetzung des Satzes die Folge der charakteristischen Funktion (1) gegen 
die Funktion j(f) konvergiert, so ist f(0) = 1. Da darüber hinaus die Funktion 
f(&) stetig ist, kann man eine hinreichend kleine positive Zahl so wählen, daß 
für sie die Ungleichung 


[ro « >1-;>d+4z (4) 


1 
2r 


besteht. Gleichzeitig kann man aber X.> * und ein so großes K wählen, daß 
für k> K bar 


8 = Fu (X) — Fu (X) <d+% 


ist. Da /„,(f) eine charakteristische Funktion ist, so ist 


Ss 1,0 dt = f | fe“ ai dF,,(@). 
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Das auf der rechten Seite dieser Gleichung stehende Integral kann man folgender- 
maßen abschätzen. Einerseits ist wegen |e'*| = 1 


<2r. 


T 
f eitz di 
—r 


Andererseits ist 
T 


j etz dt -Zsinrz, 


—r 


und da |sinz| < 1 ist, so erhalten wir für |2| > X die Ungleichung 


[“ dt 


—r 


2 


Wenden wir nun die erste Abschätzung für |x| < X und die zweite für |x| > X 
an, so bekommen wir die Ungleichung 


j in,(0 di| < | ( ’ eitz a) dF,(&) 
_r eIl<I‘—r 
r . 9 
+ / (Sera) ar <2rd.+7, 
eI> X \‘—r 
folglich ist 
1 ü e 
| [mau <s+5- 
Diese Ungleichung strebt im Grenzfall gegen 
1 r € 
„| [Wwal<s+z, 


was offensichtlich der Ungleichung (4) widerspricht. 

Die Funktion F(x), gegen die die Folge F,(@) im wesentlichen konvergiert, ist 
also eine Verteilungsfunktion; nach dem direkten Grenzwertsatz ist ihre charak- 
teristische Funktion ff). Um den Beweis des Satzes abzuschließen, müssen 
wir noch beweisen, daß auch die ganze Folge (2) im wesentlichen gegen die Funk- 
tion F(x) konvergiert. Angenommen, es wäre nicht so, dann ließe sich eine Teil- 
folge von Funktionen 


Fa&), Fax,» Ful@), .-- (5) 


finden, die im wesentlichen gegen eine Funktion F*(x) konvergiert, die von F(z) 
in wenigstens einer Stetigkeitsstelle verschieden ist. Nach dem bereits Bewiese- 
nen muß F(z) eine Verteilungsfunktion mit der charakteristischen Funktion 
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ft) sein. Dann ist nach dem Eindeutigkeitssatz 
F*@) = F@), 
dies widerspricht unserer Annahme. 


Wir bemerken, daß die Bedingungen des Satzes in jedem der beiden folgenden 
Fälle erfüllt sind: 

1. Die Folge charakteristischer Funktionen f„(f) konvergiert gleichmäßig 
in jedem endlichen Intervall gegen eine gewisse Funktion f(f). 

2. Die Folge charakteristischer Funktionen /„() konvergiert gegen die 
charakteristische Funktion f(t). 


Beispiel. Als Beispiel für die Anwendung der Grenzwertsätze betrachten 
wir den Beweis des Integralsatzes von MoIvRE-LAPLAor. 
Im Beispiel 4, $ 35, haben wir die charakteristische Funktion der Zufallsgröße 


n — EZA2 pestimmt: 
u? a\" 
ae Er pe). 


npq 
Die Entwicklung in eine MacLaurissche Reihe ergibt 


VL. ev 
ac" Var pe la =1- a4 m), 
dabei ist 


Be SE ALN ut I a ud 32 
Bu 2 3 lm) ve 


Da für n — oodie Beziehung 


R„—>0 
besteht, so ist 


o=-La+m]f-e*. 


Auf Grund der Umkehrung des direkten Grenzwertsatzes ergibt sich hieraus bei 
beliebigem x für n — oo die Beziehung 


zz 
Po? <a] = [: 2 dz. 
npq I 


Vans 


Aus der Stetigkeit der Grenzfunktion leitet man leicht ab, daß diese Konver- 
genz bezüglich x gleichmäßig ist. 
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Das Ziel dieses Paragraphen ist es, eine erschöpfende Beschreibung der Klasse 
der charakteristischen Funktionen zu geben. Der unten angeführte Hauptsatz 
wurde gleichzeitig von A. J. CHINTscHIN und S. BocHNER gefunden und von 
BoCHNER zuerst veröffentlicht. 
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Zur Formulierung und zum Beweis dieses Satzes müssen wir zunächst einen 
neuen Begriff einführen. Wir sagen, eine stetige Funktion ff) eines reellen 
Arguments £ sei positiv definit im Intervall — oo <t<< oo, wenn für beliebige 
reelle Zahlen t,,t,,..... , &„, für beliebige komplexe Zahlen &,, &, ... , &, und jede 
natürliche Zahl n die Ungleichung 


zZ Iih—1)5,>0 () 
k=1j=1 
erfüllt ist. . 


Wir rechnen nun einige einfachste Eigenschaften der positiv definiten Funk- 
tionen aus. 


1. (0) >0. Wir setzenn =1,4,=0, & = 1; dann folgt aus der Bedingung (1) 
die Ungleichung 


B> Ef —)&E = f0)>0. 


ke1j-1 
2. Für beliebige reelle t gilt 
K-9=/®. 
Zum Beweis setzen wir in (I) r=23,4,=0,%,=t und £, & beliebig an. 
Nach Voraussetzung erhalten wir 


:» 2 zn 
0<y Eu—HEE 
k=elj=-1 


=0—-)EA+ MO -dEA+M-VRA+ MY 


= 0) (a + Ed HH AHA + WE (2) 
die Größe 


I—5 &ı &, Hr /® & &, 

muß daher reell sein. Setzen wir also (= +iß,[ÖH=%+tißy 
Kh=y+id K&=Yy—id, so muß die Gleichung 

yd+hy—nö+Ry—0 
gelten. Da £, und &, und damit auch y und ö beliebig sind, so muß 

4 =0,fh+h=0 
sein. Hieraus folgt unsere Behauptung. 
3. Für beliebige reelle 2 ist 
/ol< 10). 

Wir setzen in der Ungleichung (2) & = ff), & = — |f(Ö|; dann ist nach dem 


vorigen 
2/0) yo — io ol — ol liol 20. 
Hieraus erhalten wir für |f(t)| + 0 die Ungleichung. 
ro) > 9]. 
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Ist aber |f(f)| = 0, so ist auf Grund der Eigenschaft 1 
f0) > 0]. 


Aus dem Bewiesenen folgt u. a.: Ist für eine positiv definite Funktion f(0) = 0, 
so ist f(f) = 0. 


Satz von BoCHNER-CHINTSCHIN. Eine stelige Funktion fft), die der 
Bedingung f(0) = 1 genügt, ist dann und nur dann eine charakteristische Funktion, 
wenn sie positiv definit ist. 


Beweis. In der einen Richtung ist der Satz trivial. Ist nämlich 


I) = Je dF@) 


mit einer gewissen Verteilungsfunktion F(x), so erhalten wir bei beliebigem 


ganzem n, beliebigen reellen f,,t,...,f, und komplexen Zahlen &,&,...,& 
n Rn Zah n n N ER _ 
E Eib—Y)uh= EL 5 | j er ar) 5 
k=e1lj-1l k=1j-1l 


e: SEE dF@) 


k=1j=-l 


-/((8 n er p | (ze: 5) dr@) 


- [12 


Um zu zeigen, daß die Bedingungen des Satzes hinreichend sind, müssen wir 
einige komplizierte Überlegungen durchführen. 

Die folgenden Darlegungen entnehmen wir einem Buch von J. W. Linnik. 
Sie beruhen wesentlich auf dem Satz 3, $ 36, den Grenzwertsätzen für charak- 
teristische Funktionen und dem folgenden 

Lemma. Wenn die Funktion f{f) meßbar, beschränkt und integrierbar in einem 
Intervall (—T, T) ist und 


Pla) = 2 ed, 6) 


Pi ei 3 
k 


"ar@)>0. 


so ist die Funktion p(x) auf der ganzen Achse integrierbar. 


Beweis. Da die Funktion p(x) stetig ist, kann man sie über jedes endliche 
Intervall integrieren. Wir setzen 


G(&) -/f p(2) dz. 


Diese Funktion ist nicht abnehmend, weil p(z) nicht negativ ist; zum Beweis 
des Lemmas genügt es daher, die Beschränktheit von G(z) zu zeigen. Zu diesem 
Zweck betrachten wir die Funktion 


F@) 4 [ 6) du. 


16 Gnedenko 


228 VII. Charakteristische Funktionen 
Natürlich ist 


22 
Fe) 22 | au = Ge), 


und es genügt daher die Beschränktheit der Funktion F(z) zu beweisen. 
Wie man leicht sieht, ist 


T 
Ga) =2 j Ft de 
T 


ey 7 5: 
Br sin? — 
nt | = mat | ZEma. 
—T 


—T 


und daher 


Es sei M = sup |f(z)|; dann ist 


T oo 

sin? xt sin? u 
= [ 2 Qa<am | rd 
—rT — co 


Offensichtlich gilt auch 


T nt x 
4 2 sin? u 
”; f f id <2M f = 
—rT —0 00 


Damit ist die Beschränktheit der Funktionen F(z) und G(t) bewiesen. 
Wir setzen jetzt die Funktion f{i) als positiv definit und stetig voraus, und 
es sei /{0) = 1. Wir betrachten für ein z > 0 die Funktion 


Pe) = | [run eivz erivz dudv. 


Sie ist nicht negativ, da f(f) positiv definit ist (das Doppelintegral ist der Grenz- 
wert der entsprechenden Summen). Wenn wir in dem Doppelintegral die Sub- 
stitution 

t=u—v, z=u 


ausführen, so finden wir nach elementaren Umformungen 


px) -[e- I El jo e'zdt. 


Da die Funktion p,(z) nichtnegativ und'in der Form (3) darstellbar ist, können 
wir das eben bewiesene Lemma auf sie anwenden; p,(x) ist also über die ganze 
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Achse integrierbar. Die Funktion f(t) ist stetig, und daher gilt nach Satz 3, 
$ 36, 


x 
t r 
(1-E)no = | pu@) e'* az 
—o@ 
für alle £ (j{| < z). Insbesondere gilt für i = 0 
x 
S Pe) de = 0) =1. 
Daher ist p,(z) die Dichte einer gewissen Wahrscheinlichkeitsverteilung, und 


1-8) /($ ist die entsprechende charakteristische Funktion. Bei z— co 
strebt die Funktion f 
(1-E)no 


gleichmäßig in jedem Intervall von f gegen die Funktion f(f). Daher ist f(f) 
eine charakteristische Funktion, und unser Satz ist vollständig bewiesen. 


8& 40. Die charakteristischen Funktionen mehrdimensionaler Zufallsgrößen 


In diesem Parägraphen stellen wir ohne Beweise die Haupteigenschaften 
der charakteristischen Funktionen mehrdimensionaler Zufallsgrößen zusammen. 

Unter der charakteristischen Funktion einer n-dimensionalen Zufallsgröße 
(Eu &»:--,&) versteht man die mathematische Erwartung der Größe 
Muth tinen); fd... ,t„ sind dabei reelle Veränderliche: 


Maln..W)= Mepli hs) (1) 


Ist F(z,%,...,%,) die Verteilungsfunktion der Größe ($&,, &3 - - - » &,) , SO 
ist — wie wir von früher her wissen —!) 


7, 36 FRSERRR Eon WEBER | ep(i&an) dF(z,...,2)- (2) 


Ähnlich wie im eindimensionalen Falle ist die charakteristische Funktion einer 
n-dimensionalen Zufallsgröße in dem ganzen Raum (—- w<t4<-+ co, 
1<j<n) gleichmäßig stetig und genügt den folgenden Beziehungen: 

10,0,...,0)=1, 
Mt... ,‚WS1I C-w<tb<+o,k=1,2,..,n), 
te la: b)=lltsts:..,in): 

Mit Hilfe der charakteristischen Funktion f(t,, a, . . . ,1„) einer Zufallsgröße 
(Ei Es - - : » &n) findet man leicht die charakteristische Funktion einer beliebigen 


ı) Vergleiche Satz 1, $27, und die Bemerkung über mehrdimensionale STIELTJES- 
Integrale in $ 26. 
16* 
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k-dimensionalen (k < n) Größe (&;,, &9 - - - ‚ &), deren Komponenten die Grö- 
Ben &(1<s<n) sind. Dazu braucht man in der Formel (2) nur alle Argu- 
mente {, mits # j,(1<r<ik) gleich 0 zu setzen. So ist z.B. die charakteri- 
stische Funktion der Größe £, gleich 


hd) = Kb. Orsnse 0) . 
Aus der Definition ergibt sich folgendes: Sind die Komponenten einer Größe 


(Ei &2 . . - , &) unabhängige Zufallsgrößen, so ist ihre charakteristische Funk- 
tion gleich dem Produkt der charakteristischen Funktionen der Komponenten 


fit»... W)=MHl) Mi) Mn). 
Ebenso wie im eindimensionalen Falle gestatten die mehrdimensionalen 
charakteristischen Funktionen die Bestimmung der Momente der verschiedenen 


Ordnungen. 
So ist z.B. 


Mei... uff... [ahzh...zandFla,zu...,2) 


_ or [retten fe. 
tk ötkı a atkn =h=—ln=0 3 
Für die Berechnung der charakteristischen Funktionen ist die Kenntnis des 
folgenden Satzes sehr nützlich; den Beweis führt der Leser leicht selbst durch. 


Satz 1. Ist die charakteristische Funktion der Größe (&,, &» -- - , &,) gleich 
KEte -- -, in), so ist die charakferistische Funktion der Größen (o, & + &,, 02&3 
+ du... & + a,), wobei a, und oj(1 <j <n) reelle Konstanten sind, gleich 


n 
exp (i 20; t) * Kor a Ogtar - - + Ontn)- 
n= 


Beispiel 1. Wir berechnen die charakteristische Funktion einer nach dem 
Normalgesetz verteilten NE ine 


Pe ae-2raHn). © 


Auf Grund der Formel (2) ist 
Kit) = S Je"*Hh9 pla, y) de dy. 
Durch WATER EEE PERERLIDR können wir fff,, t,) auf die Gestalt 


fa t.) Pr 5 (Mreruu+l) 1 = Fe dv or lreruutd) 
ya) = — 


bringen. 


Beispiel 2. Unter Anwendung von Satz 1 finden wir die charakteristische 
Funktion eines nach dem Normalgesetz verteilten Vektors (N,, N2): 
1 


Pl, 9) rl —r) 
—.a)? —ay—b) (w-—b} 
x exp |— reelle un EEE Bann a. (4) 


0,0 03 
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Setzen wr „=, &+ 4,012 =0g& + b, so ist die Größe (£,, &) nach dem 
Gesetz (3) verteilt. Nach Satz 1 ist die eharakteristische Funktion der Größe 


(N, 2) gleich 
1 9 2 
Alt) = rpliah +ib, Zi +25 rhh +). 


Aus der Definition der charakteristischen Funktion ergibt sich der folgende 
Satz. 


Satz2. Istf(t,t,...,t,) die charakteristische Funktion der Größe (&,, &» - - - » 
€.) ‚ so ist die charakteristische Funktion der Summe & + &+*-- + £&, gleich 


Ef: 
Bemerkung. 
fe) = fl, tta,...,£,) 
ist die charakteristische Funktion der Summe, +b., + +1, &- 


Beispiel 3. Wir wenden den Satz 2 zur Bestimmung der Verteilungsfunk- 
tion der Summe 7, -+n, an, wobei (7,27) nach dem Gesetz (4) verteilt sei. 
Nach Satz 2 ist die charakteristische Funktion der Summe 7, + 2, gleich 


fü) = exp il (a +) (+27, +0) R 


Wir wissen (Beispiel 1, $35), daß dies die charakteristische Funktion des 
Normalgesetzes mit der mathematischen Erwartung a + b und der Dispersion 
o?+2ro,0,+ 0% ist. Dieses Resultat haben wir früher direkt gewonnen 
($ 24, Beispiel 2). 

Wir sahen zu Beginn dieses Kapitels, daß die charakteristische Funktion 
der Summe unabhängiger Zufallsgrößen gleich dem Produkt der charakteristi- 
schen Funktionen der Summanden ist. Wir wollen nun zeigen, daß diese Eigen- 
schaft nur ein notwendiges, aber kein hinreichendes Kriterium für die Unab- 
hängigkeit von Zufallsgrößen ist. Zu diesem Zweck betrachten wir eine zwei- 
dimensionale Zufallsgröße (£, ‚n), deren Verteilungsdichte in der Form 


P(&, 9) = Pı(2) Ps(y) + Pr) yy) — Pu) y@) 


darstellbar ist, wobei p,(x) und p,(x) eindimensionale Verteilungsdichten und 
Y(z) und y(x) (P(x) + y(x)) ungerade integrierbare Funktionen sind. Man sieht 
leicht, daß solche Verteilungsdichten existieren. 

Die Funktion 


P(&, y) = z e7 Iel — Ipl {1 + xy el —ı y e-1—2u} 


ist ein Beispiel dieser Art. Für beliebige x, y genügt sie der Ungleichung p(z, y) 
> 0, und außerdem ist 


I Sp wariy=1. 
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Die Zufallsgrößen £ und 7 sind abhängig, denn ihre gemeinsame Verteilungs- 
dichte läßt sich nicht als Produkt zweier Faktoren darstellen, von denen der 
eine nur von x und der andere nur von y abhängt. Die Verteilungsdichte der 
Komponente £ ist gleich 


Pl) = SP y) dy = Pi), 
die Verteilungsdichte der Komponente n ist gleich 
Pa(y) = S Pl, y) dr = pi). 


Die zweidimensionale charakteristische Funktion des Vektors (£, n) ist gleich 
I& 2) = hl) ke) 


+f Sererien ga) y)dedy— [ Serrtirn ya) pl) de dy 


—0 —o 0 —oo 


mit 
h& =Ji e!*p,(e) de, falr) ri ev p.(y) dy. 


In unserem speziellen Beispiel ist die charakteristische Funktion des Vektors 
(&, n) gleich 
1 


2 1 
9 = arware +Atlarmorm PBrmarm' 
Nach Satz 2 ist die charakteristische Funktion der Summe & +n ganz all- 


gemein gleich 
IDEE AUFAUR 


d.h. gleich dem Produkt der charakteristischen Funktionen der Summanden. 
Damit haben wir gezeigt, daß es abhängige Zufallsgrößen gibt, für die die charak- 
teristische Funktion der Summe gleich dem Produkt der charakteristischen 
Funktionen der Summanden ist. 

Wichtig ist, daß auch im mehrdimensionalen Falle folgender Satz gilt: 


Satz 3. Die Verteilungsfunktion F(x,,%,...,%,) ist durch ihre charakte- 
ristische Funktion eindeutig bestimmt. i 
Der Beweis dieses Satzes beruht auf der Umkehrformel. 


Satz4. Ist (lt, ...,t„) die charakterisiische Funktion und F(x,, X, - . : , %n) 


die Verteilungsfunktion der Zufallsgröße (£,, & - - . ‚ &n), 50 ist 
Pla, <&,<b,k= 1:2, ;. „A 


3 r F it it 
: 1 n a, __ ‚itb; 
im an | I ID rw. wand...dh, 
AT-T 


a, und b, sind dabei beliebige reelle Zahlen, die nur der folgenden Bedingung unter- 
worfen sind: Die Wahrscheinlichkeit dafür, daß (&,,...,&,) auf den Rand des 
Parallelepipeds a, <& <bik=1,2,...,n) fällt, ist gleich Null. 
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Genauso wie im eindimensionalen Falle gilt auch hier der direkte Grenz- 
wertsatz und seine Umkehrung. Wir halten uns dabei nicht weiter auf. 

Beispiel 4. Man sagt, eine n-dimensionale Zufallsgröße (&,, &, - - - , En) 
besitze eine nicht ausgeartete (eigentliche) n-dimensionale Normalverteilung, wenn 
ihre Verteilungsdichte von der Form 

1 
— — Ar, 2. -., Z, 
Papa... )=Ce ° u 
ist, wobei 


Ka iu. 0) = Z Bukn — ) 5 — a) 


eine positiv definite quadratische Form, C, a, und b,, reelle Konstante sind. 
Einfache Rechnungen zeigen!), daß 


C= (2m) "VD 


mit 
bu, dia - - - din 
1 
Dez Dana - - - Dan 


ist. Wir bezeichnen mit D,; die dem Element b,,; entsprechende Unterdeter- 
minante von D, dann ist 


D ; 
M;=4,5=-D5-7) (=12...,n, 
M(&; — a) (&;— a;) D; ars 
wi IM FF A ME 
0; DD, ij ) 
Die Determinante D und ihre Hauptminoren sind positiv. 


Mit den üblichen Rechnungen prüft man leicht nach, daß die charakteristische 
Funktion der Größe (£&,, &4 . - . » &n) gleich 


Ti; 


‘2 PIERRE. E E it 

nen 00. Ff, 
RnB BEN 2 yaıjeı I RI K 
ist. Somit ist die n-dimensionale Normalverteilung durch Vorgabe der mathema- 
tischen Erwartung und der Dispersion vollständig bestimmt. Aus dem Ausdruck 
für die charakteristische Funktion einer n-dimensionälen normal verteilten 
Zufallsgröße ersehen wir, daß die Verteilung der Größe 


(&u Ei ...; &,) 
bei beliebigen 1<i, <i,<..-<i,<n eine k-dimensionale Normalver- 
teilung ist. 


ı) Das allgemeine Verfahren bei Berechnungen ähnlicher Art besteht darin, daß man 
durch Variablensubstitution die Form Q in eine Summe von Quadraten überführt und 
alle Rechnungen in den neuen Veränderlichen durchführt. 
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Übungen 


1. Es ist zu beweisen, daß die Funktionen 


oo x 71 
hÜ)= 3 a,coskt, fell) = I ape”k' 
k=0 k=0 


oo 
mit a4. >0 und Z a, =]1 charakteristische Funktionen sind; man bestimme die 
k=0 
zugehörigen Wahrscheinlichkeitsverteilungen. 


2. Man bestimme die charakteristische Funktion für die folgenden Wahrscheinlichkeits- 


dichten: 


a) pl) = emal ; 


[7 
a’ 
0 für |2| > e, 
Pie) [1-8 für | <o; 
2 sin? = 
d) Pla) <— a 


Bemerkung: Der aufmerksame Leser wird feststellen, daß die Beispiele a) und b) 
sowie c) und d) sozusagen einander invers sind. 


. Man beweise, daß die Funktionen 


1 1 1 
Al) = &fr’ aM = nr Pt) = Ort 


bzw. die charakteristischen Funktionen der Verteilungsdichten 


1 n 
Pla) = —— > Palz) = — —— Pax) = —— 
260 46 = 2 Sin 


sind. 
. Man bestimme die Wahrscheinlichkeitsverteilungen der Zufallsgrößen, deren charak- 


teristische Funktionen gleich 
[3 sinat 


1+4t’ . at 


a) cost, b) cos®t, e) 
sind. 
Es ist zu beweisen, daß die durch die Gleichungen 


= 
O=H—),  Mi+2o=fl, IM=— für o<i<a 


definierte Funktion eine charakteristische Funktion ist. 


Bemerkung: Die charakteristischen Funktionen der Beispie!e 2d und 5 besitzen die 
folgende bemerkenswerte Eigenschaft: 


ki=hl) für |<, 
ft) =hlt) für il>aundt+ +2a,.... 


10. 


11. 


12. 


13. 


Übungen 235 


Es existieren also charakteristische Funktionen, deren Werte auf einem beliebig 
großen Intervall [— a, + a] zusammenfallen und die nicht identisch gleich sind. Das 
erste Beispiel von zwei solchen charakteristischen Funktionen stammt von B.W. 
GneDEnko. M.G. Kreın gab notwendige und hinreichende Bedingungen an, unter 
denen aus der Gleichheit zweier charakteristischer Funktionen auf irgendeinem Inter- 
vall [— a, + a] ihre identische Gleichheit folgt. 


. Man beweise, daß man unabhängige Zufallsgrößen £,, £,,£, derart finden kann, daß 


die Wahrscheinlichkeitsverteilungen von &, und &, verschieden, die Verteilungsfunk- 
tionen der Summen £&, + &, und &, + £&, jedoch gleich sind. 


Hinweis: Man benutze die Resultate der Beispiele 2 d und 5. 


. Man beweise: Ist ff) eine charakteristische Funktion, die für le] >a gleich Null 


ist, so ist auch die durch die Gleichungen 
(= ft) für |t| <a, 
I Tot +20) für —o<t<o, 


definierte Funktion p(t) eine charakteristische Funktion. 
Hinweis: Man benutze den Satz von BoCHNER—CHINTSCHIN. 


. Man beweise:; Ist; f(t) eine charakteristische Funktion, so ist auch 


pl) = ella—ı 
eine charakteristische Funktion. 


. Man beweise: Ist f(t) eine charakteristische Funktion, so ist auch 


t 
0-4 [Ma 
{) 


eine charakteristische Funktion. 


Man beweise, daß für eine beliebige reelle charakteristische Funktion g(t) die Un- 
gleichung 

1-2 satl— pl}, 
und somit für jede beliebige charakteristische Funktion die Ungleichung 


1-1 eYy® <a — fe) 
besteht. 


Man beweise, daß für eine beliebige reelle charakteristische Funktion die Ungleichung 


1+p(2:) 2 pl)? 
gilt. 
Man beweise: Ist F(x) eine Verteilungsfunktion und /(t) die ihr entsprechende charak- 
teristische Funktion, so gilt für beliebige Werte von x die Gleichung 


1 
‚im 37 f ft) etz dt = Fix + 0) — Fix 0)}. 
-T 


Man beweise: Ist F(x) eine Verteilungsfunktion, f(t) die ihr entsprechende charak- 
teristische Funktion, und sind x, die Abszissen der Sprungstellen der Funktion. F(x), 
so ist 


2 
ar) Yo d= Le (+0 — Fla,—0)}. 
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14. 


15. 


16. 


17. 


Man beweise: Besitzt eine Zufallsgröße eine Verteilungsdichte, so konvergiert ihre 
charakteristische Funktion für ?—> oo gegen Null. 


Die Zufallsgröße & sei nach dem Porssonschen Gesetz verteilt; M&=A. Man be- 
weise, daß für A— co die Verteilung der Größe u gegen die Normalverteilung 
mit der mathematischen Erwartung 0 und der Dispersion 1 strebt. 

Die Zufallsgröße £ besitze die Wahrscheinlichkeitsdichte 


ı) fürz<0, 
& 
Mami 1 feed. 


Te) 


—o 
Man beweise, daß für & — oo die Verteilung der Größe ß 


gegen die Normal- 


verteilung mit den Parametern a = 0, o = 1 konvergiert. 


Bemerkung: Die Ergebnisse der Aufgaben 15 und 16 gestatten es, zur Ermittlung 
der Wahrscheinlichkeiten P {a <&£<b} für große Werte A (bzw. &) die Tabellen der 
Normalverteilung zu benutzen. Es zeigt sich, daß besonders für die x?-Verteilung 
die angegebene Limesbeziehung schon für n > 30 eine sehr gute Genauigkeit ergibt. 
Diese Tatsache wird in der Statistik ständig ausgenutzt. 


Man beweise: Ist p(t) eine charakteristische Funktion und Y(t) so gewählt, daß für 
eine gewisse Folge {h,} (kn > © für n — oo) die Produkte 
A) F (Ant) = Int) 


ebenfalls charakteristische Funktionen sind, so ist die Funktion Y(t) eine charak- 
teristische Funktion. 


VII. 
KLASSISCHE GRENZWERTSÄTZE 


$ 41. Aufgabenstellung 


Der Integralgrenzwertsatz von Moıvke-LArLAcz, den wir in Kapitel II 
bewiesen haben, bildete den Ausgangspunkt einer Vielzahl von Untersuchungen, 
die sowohl für die Wahrscheinlichkeitsrechnung selbst als auch für ihre zahl- 
reichen Anwendungen in der Naturwissenschaft, in den technischen und ökono- 
mischen Wissenschaften eine fundamentale Bedeutung besitzen. Um uns eine 
Vorstellung davon zu verschaffen, in welcher Richtung diese Untersuchungen 
lagen, geben wir dem Satz von MoıvreE-LArLaoz eine etwas andere Form. 
Bezeichnen wir — wie wir es schon häufig taten — mit u, die Anzahl des Auf- 
tretens des Ereignisses A beim k-ten Versuch, so ist die Anzahl des Auftretens 


” 
des Ereignisses A in n aufeinanderfolgenden Versuchen gleich 3 u;. Ferner 
k=1 


n n 
haben wir in Beispiel 5, $ 28, berechnet, daß M Yu, =npundDY w.=npq 
k=1 k=1 2 


ist. Der Satz von Morvre-LarLaoe läßt sich daher folgendermaßen schreiben: 
Für n— oogilt 


& (m —M u) u} 
Pla<* IE 2 dz. (1) 


Bd > 
) z D Ek Y2=; 
k=1 
In Worten läßt sich das so formulieren: Die Wahrscheinlichkeit dafür, daß die 
Summe der Abweichung unabhängiger Zufallsgrößen, die die beiden Werte 0 
und 1 mit den Wahrscheinlichkeiten gundp=1—g(0 <p<<1) annehmen, 
von ihren mathematischen Erwartungen, dividiert durch die Quadratwurzel aus 


der Summe der Dispersionen der Summanden, zwischen den Grenzen a und 5b 
liegt, strebt bei unbeschränktem Wachsen der Anzahl der Summanden gleich- 


b 
z’ 
mäßig bezüglich a und b gegen das Integral — | e ? az. 
Ver 
a 


Es erhebt sich nun die folgende Frage: Inwieweit ist die Gültigkeit der 
Beziehung (1) durch die spezielle Wahl der Summanden 4; bedingt, besteht sie 
nicht auch noch unter schwächeren Voraussetzungen über die Verteilungsfunk- 
tionen der Summanden? Die Formulierung dieser Aufgabe sowie ihre Lösung 
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stellen eines der bedeutendsten Verdienste von TSCHEBYSCHEW und seiner 
Schüler A. A. Markow und A. M. Lsarunow dar. Ihre Untersuchungen 
zeigten, daß man den Summanden nur ganz allgemeine Beschränkungen aufzu- 
erlegen braucht. Sie bestehen darin, daß die einzelnen Summanden auf die 
Summe einen nur verschwindend geringen Einfluß ausüben dürfen. Im folgen- 
den Paragraphen werden wir diese Bedingung genau formulieren. Der Grund 
für die außerordentliche Bedeutung dieser Resultate für die Anwendungen liegt 
im Wesen der Massenerscheinungen. Die Untersuchung der Gesetzmäßigkeiten 
dieser Erscheinungen ist aber — wie wir schon früher bemerkten — der Gegen- 
stand der Wahrscheinlichkeitsrechnung. 

Die Anwendung der Ergebnisse der Wahrscheinlichkeitsrechnung in Natur- 
wissenschaft und Technik vollzieht sich in vielen wichtigen Fällen folgender- 
maßen. Man nimmt an, daß ein Prozeß unter dem Einfluß einer großen Anzahl 
unabhängig voneinander wirkender zufälliger Faktoren vor sich geht, von 
denen jeder einzelne den Verlauf der Erscheinung oder des Prozesses verschwin- 
dend gering verändert. Der Forscher, den nur die Untersuchung des Prozesses 
als Ganzes und nicht die Wirkung der einzelnen Faktoren interessiert, beobach- 
tet nur die summarische Wirkung dieser Faktoren. Hier zwei typische Beispiele: 


Beispiel 1. Es werde irgendeine Messung ausgeführt. Auf das Resultat 
wirkt unvermeidlich eine große Anzahl von Faktoren ein, die in der Messung 
Fehler verursachen. Solche Fehler können durch das Meßgerät hervorgerufen 
werden, das sich auf Grund verschiedener atmosphärischer oder mechanischer 
Einflüsse ein klein wenig verändern kann. Ferner gehören hierher auch die 
persönlichen Fehler des Beobachters (die persönliche Gleichung), die durch sein 
individuelles Hör- oder Sehvermögen bedingt sind und die sich in Abhängigkeit 
von dem psychischen oder physischen Zustand des Beobachters ebenfalls un- 
wesentlich verändern können usw. Jeder dieser Faktoren ruft nur einen kleinen 
Fehler hervor. Doch auf die Messung selbst wirken schließlich alle diese Fehler 
zusammen ein, man beobachtet einen „summarischen‘“ Fehler. Anders aus- 
gedrückt, der tatsächlich beobachtete Meßfehler ist eine Zufallsgröße, welche 
die Summe einer ungeheuren Anzahl in ihrer Größe verschwindend kleiner und 
untereinander unabhängiger Zufallsgrößen ist. Und obwohl diese letzteren 
wie auch ihre Verteilungsfunktionen unbekannt sind, ist ihr Einfluß auf das 
Meßresultat merklich und muß daher untersucht werden. 


Beispiel 2. Bei einer Massenproduktion, wie sie in vielen Zweigen der In- 
dustrie vorkommt, werden große Mengen gleichartiger Gegenstände hergestellt. 
Wir achten nun auf irgendein zahlenmäßig zu erfassendes Merkmal (Größe, 
Gewicht, usw.) des uns interessierenden Produkts. Da das Produkt den tech- 
nischen Normen entsprechen soll, wird für dieses Merkmal ein bestimmter 
Sollwert vorgeschrieben sein. Praktisch wird man jedoch stets eine gewisse 
Abweichung von diesem Sollwert beobachten. In einem gut eingerichteten 
Produktionsprozeß können diese Abweichungen nur durch zufällige Ursachen 
hervorgerufen werden, von denen jede nur einen unmerklichen Eifekt hervor- 
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ruft. Ihre summarische Einwirkung zeigt jedoch eine merkliche Abweichung 
von der Norm. 

Ähnliche Beispiele kann man in beliebiger Anzahl anführen. 

Es ergibt sich also die Aufgabe, die Gesetzmäßigkeiten zu untersuchen, die den 
Summen einer großen Anzahl unabhängiger Zufallsgrößen zu eigen sind. Jede 
dieser Zufallsgrößen soll dabei nur einen kleinen Einfluß auf die Summe nehmen. 
Diese letzte Forderung werden wir später noch genauer fassen. Anstatt die 
Summe einer sehr großen, jedoch endlichen Anzahl von Summanden zu unter- 
suchen, werden wir eine Folge von Summen mit einer immer größer werdenden 
Anzahl von Summanden betrachten und annehmen, daß die Lösungen der uns 
interessierenden Aufgaben durch die Grenzverteilungsfunktionen für die Folge 
der Verteilungsfunktionen dieser Summen gegeben sind. Ein solcher Übergang 
von einer endlichen Fragestellung zu einer Grenzwertaufgabe ist sowohl für die 
moderne Mathematik als auch für viele Gebiete der Naturwissenschaft üblich 
geworden. 

Wir betrachten also die folgende Aufgabe: Gegeben sei eine Folge unabhän- 
giger Zufallsgrößen 


FR PR  GERREE 


von denen wir voraussetzen, daß sie endliche mathematische Erwartungen und 
Dispersionen besitzen. Wir benutzen im SopnöRm einige AHEDRGEN: 


= M&, »b=DE, B} = zu -DER. 


Gefragt ist nach den Bedingungen, die man Fa Größen = auferlegen muß, 
damit die Verteilungsfunktionen der Summen 


Ga) 6) 
k=1 


gegen das Normalgesetz konvergieren. Im folgenden Paragraphen werden wir 
sehen, daß hierfür die LINDEBERGsche Bedingung hinreichend ist: Bei beliebigem 
r>Dist 
. 1 
lim z5 2 («— a)? dFx(@a)=0; 
n> 
k—apl>rB, 

F, bezeichnet dabei die Verteilungsfunktion der Größe &,. 


Wir wollen den Inhalt dieser Bedingung etwas erläutern. 
Wir bezeichnen mit A, das Ereignis 


&—a|>rB, (k=1,2,...,n) 
und schätzen die Wahrscheinlichkeit 


P{max | —a|>rB,} 
1l<k<n 
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p we te, Se P{fA, + A, ++ Au} 
1<ks 


P{A, + Ag +++ A,} sz P{A,} 
=1 
ist, so finden wir mit 
: 1 
Pfay= | das az | (.— a)? dFy(e) 
e-2]> vB, ee; >rB 


die Ungleichung 
P( ms ax | —ai| >rB, A<ap =E 5; (2 — 0)? dFy() . 


gr >rB, 


Auf Grund der Linpegzraschen Bedingungen strebt die letzte Summe für n >00 
bei beliebigem konstanten r > 0 gegen 0. Die LinDEBERGsche tea ist 


also eine eigentümliche Forderung dafür, daß die Summanden ; (& — 4,) 
in der Summe (2) gleichmäßig klein sind. 

Wir heben noch einmal hervor, daß die Bedeutung der für die Konvergenz 
der Verteilungsfunktionen der Summen (2) gegen das Normalgesetz hinrei- 
chenden Bedingungen bereits durch die Untersuchungen von A. A. MARKow 
und A. N. Lsarunow vollständig aufgeklärt worden ist. 


$& 42. Der Satz von Lıarunow 


Wir beweisen zunächst, daß die Linpeserasche Bedingung hinreichend ist. 


Satz. Wenn eine Folge unabhängiger Zufallsgrößen &, Eu :-:s En... bei 
beliebigem konstantem r > 0 der Linpeseraschen Bedingung 


lim 4; >, ' (2 — a)? dFy(a) = 0 © 


7 ei| >rB, 
genügt, so gilt für n — oo gleichmäßig bezüglich x die ei 


Pi Za-w<z te @) 


Beweis. Zur a führen wir die Bezeichnungen 


— 


En = » Fur) = Pie <a} 
ein. Offenbar ist 


1 
M &uı= 0, Din=zD&r 
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und somit 
n 
ZDin,=1. (2) 
k=1 
Man überzeugt sich leicht, daß sich die LinDeserasche Bedingung mit diesen 


Bezeichnungen folgendermaßen schreiben läßt 
im zZ f =dFu@)=0. (1) 


n>0 k=1 |z>r 


Die charakteristische Funktion der Summe 


>23 (& — 4) = Se, 
ist gleich 3 
Out) = IT fax d . 
k=1 


Wir müssen beweisen, daß 


»w|% 


im) e 
Lin ee] 


ist. Dazu stellen wir zunächst fest, daß die Faktoren f„,(f) für n — oo gleich- 
mäßig bezüglich k(1 <k<n) gegen Eins streben. Beachtet man nämlich die 
Gleichung M £,; = 0, so findet man 


Int) —1=[(e"—1—ita)dF,). 
Da bei beliebigem reellem a?) 
a 
le —1—ial <Z (8) 
ist, so haben wir die Ungleichung 


Im 1 <z | ware). 


1) Diese Ungleichung und eine ganze Reihe ihr ähnlicher Ungleichungen kann man auf 
folgendem Wege ableiten. Aus 


a 
Pr 1=j/ Here] <a (a >0) 


ergibt sich die Ungleichung 


& 
je? * —1—ial -| [Wen < 3 > 
ö 
Aus letzterer folgt weiter 


* _—1—ia +7 


| [uei=irtal 


fei-mas[ 30-3 AR (3°) 


USW. 
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Es sei nun e eine beliebige positive Zahl; dann ist offensichtlich 
Sa du) = Sf a®dFzua) + [ dr.) <e + [ dr). 
else Izl>s lel>e 
Der letzte Summand läßt sich nach (1’) bei hinreichend großen n kleiner als e? 


machen. Daher ist für alle hinreichend großen n gleichmäßig bezüglich k1 <k 
<n) und ?in einem beliebigen endlichen Intervall {| < 7 


In) —1|<e®T?. 
Hieraus schließen wir, daß gleichmäßig bezüglich k(1 <k<n) die Beziehung 
lim /nz(t) = 1 (4) 


n— 00 


besteht und daß bei hinreichend großem n für alle £ aus einem beliebigen end- 
lichen Intervall |t| < T die Ungleichung 


Im) —1|<+ 6) 


erfüllt ist. Wir können daher im Intervall || < T' die folgende Darstellung 
benutzen (log bezeichnet den Hauptwert des Logarithmus) 


10 gl) -2 10g far) = &log + (N) -2 (md —1) + Rn, (6) 


mit 


R= 2, ”- 


k=elı= 


Nach (5) ist 


LIED BEN > Te < Sim 1R. 


Da 


Dim —1] = 


k=1 >= 
ist, erhalten wir schließlich die Abschätzung 


etz _1—itz)dF,.@)| < 


:2] x: dF,,) = 


12 
IR <$ max 0-1. 
1<k<n 


Aus (4) folgt, daß gleichmäßig bezüglich ? in einem beliebigen endlichen Inter- 
vll k| < T fürn > 

R„—>0 (7) 
strebt. Nun ist aber 


PX; (1) = — 5 + © (&) 


ku 
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mit 
n-f + 3 [er —1-itaar, a). 
+23 
Es sei & > 0 beliebig; dann ist nach (2°) 
n . 
ge | (er 1! En dF,.() 
N alze 


k=1 
lel>e 


2 222 e 
+3 [+ i-tnarıe 
Die Ungleichungen (3) und (3’) gestatten die IR Abschätzung: 


lo1< 32 | [epdER.a) +2 3) | 2° dFy,(a) 


k=1 


iS. m 
< KM, 92 j 2° dFy4(a) + ID | x: dF,x) 
Ya'Qe Ale 
— Lie .c+ el1 — N) )% [ 22 dF,+(X). 
"el>e 


Nach Bedingung (1’) läßt sich der zweite Summand bei beliebigem e > 0 
kleiner als ein beliebiges 7 > 0 machen, sobald nur n hinreichend groß ist. Da 
€ > 0 beliebig war, können wir es so klein wählen, daß bei beliebigem n > 0 
und T für alle 2 aus dem Intervall |t| < T die Ungleichung 


lel<2n (n2n,(sn, T)) 


erfüllt ist. Diese Ungleichung zeigt, daß gleichmäßig in jedem endlichen Inter- 
vall der Werte ? 


lim 0, = 0 (9) 


n—%0 


ist. Fassen wir die Beziehungen (6), (7), (8) und (9) zusammen, so erhalten wir 
schließlich gleichmäßig in jedem endlichen Intervall von ! die Beziehung 


Pr 
lim log x) = — —- 


Der Satz ist damit bewiesen. 


Folgerung. Wenn die unabhängigen Zufallsgrößen &, &3»-.-,&m- . . gleich 
verteilt sind und eine endliche von Null verschiedene Dispersion besitzen, so gilt für 
n — 00 gleichmäßig in x die Beziehung 


Plz, 6 -Ma<a> [te 


17  Gnedenko 
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Beweis. Es genügt nachzuprüfen, ob unter den gestellten Voraussetzungen 
die LinDeBerssche Bedingung erfüllt ist. Dazu bemerken wir, daß in unserem 
Fall 

B„=byn 


ist, wobei b die Dispersion eines einzelnen Summanden bezeichnet. Wir setzen 
M£, = a ; dann gelten offensichtlich die folgenden Gleichungen: 


m | e-orane 
ze k—a>rB, 
= un @— dA) = (© — a)? dFy(a).. 
lz—al>rB, z—al>rB, 


Da die Dispersion positiv und nach Voraussetzung endlich ist, strebt das Inte- 
gral auf der rechten Seite der letzten Gleichung für n — oo gegen Null. 


Satz vonLsarunow. Wenn man für eine Folge unabhängiger Zufallsgrößen 
En &p + &m.. . eine positive Zahl ö6> 0 so wählen kann, daß für n — oo die 
Beziehung 


1 n 
ar 2 Matt (10) 


besteht, so gilt für n — oo gleichmäßig in 


Piz: Ie- <a alte 


Beweis. Es genügt wieder nachzuweisen, daß aus der Lsapunowschen 
Bedingung (10) die Lmmpeserasche Bedingung folgt. Dies ergibt sich jedoch 
aus der folgenden Kette von Ungleichungen 


ke = (© — a,)? dFy(e) 


e-al>rB, 
i ; er Z [e-[* dr) 
—_a,l2+0 er 
ug | Pers 
=ı 


lz—a,l>rB, 


$ 43. Der lokale Grenzwertsatz 


Wir führen nun hinreichende Bedingungen für die Anwendung eines weiteren 
klassischen Grenzwertsatzes — des lokalen Grenzwertsatzes — an. Dabei be- 
schränken wir uns nur auf den Fall unabhängiger Summanden, die ein und 
dieselbe Wahrscheinlichkeitsverteilung besitzen. 
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Wir wollen sagen, eine diskrete Zufallsgröße & besitze eine „giiterförmige 
‚Verteilung‘, wenn es Zahlen a und h > 0 derart gibt, daß sich alle möglichen 
Werte von Ein der Form a+kh darstellen lassen, wobei der Parameter k 
beliebige ganze Werte annehmen kann (— ®@<k< m). 

Gitterförmig sind z. B. die Poıssoxsche Verteilung, die BERNoULLIsche Ver- 
teilung und andere. 

Die Bedingungen dafür, daß die Verteilung einer Zufallsgröße & gitterförmig 
ist, wollen wir nun mit Hilfe der charakteristischen Funktionen ausdrücken. 
Dazu beweisen wir folgenden Hilfssatz. 


Hilfssatz. Eine Zufallsgröße & besitzt dann und nur dann eine gitterförmige 
Verteilung, wenn für ein gewisses t + O der absolute Betrag ihrer charakteristischen 
Funktion gleich Eins ist. 


Beweis. Wenn £ gitterförmig verteilt und p; die Wahrscheinlichkeit der 
Gleichung &= a + kh ist, so ist die charakteristische Funktion der Größe & 
gleich 


) © 
f) = 5 pP eit(a+kh) _ giat E Pr dich 
k 


=— 00 k=—o 
Hieraus finden wir die Beziehung 
2ril 


2n mil © 2nik 
%) Br Pr € u DE 
h 2. 


Wir sehen also, daß für jede gitterförmige Verteilung 


27 
1) 
ist. Wir setzen nun voraus, daß für ein gewisses i, # 0 


Mel =1 


sei und beweisen, daß dann £ eine gitterförmige Verteilung besitzt. Tetztere 
Gleichung besagt nämlich, daß für ein gewisses © 


Kt) = €® 


F ehr dF(x) — ei 


=1 


ist. Es ist also 


und somit 
[et -NdFa)=1. 
Hieraus ergibt sich die Gleichung 
S eos(hc— ©O)dFa)=1. 
Diese Gleichung ist nur dann möglich, wenn die Funktion F(x) nur für solche 
Werte x wachsen kann, für die 
eos (hc — 9)=1 
17* 
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ist. Dies bedeutet, daß die möglichen Werte von £ die Gestalt 


haben müssen, q. e.d. 

Die Zahl h nennen wir den „Schritt der Verteilung“. 

Der Schritt der Verteilung h ist maximal, wenn es für keine Zahlen b (— &< 
b<+ oo) und A, > h gelingt, alle möglichen Werte von £in der Frmb--kh, 
darzustellen. 

Um den Unterschied zwischen den Begriffen des Verteilungsschrittes und des 
maximalen Verteilungsschrittes zu veranschaulichen, betrachten wir folgendes 
Beispiel. £ möge alle ungeraden Zahlen als Werte annehmen, offenbar lassen 
sich alle Werte von & in der Form a+khmita=0, h=1 schreiben. Der 
Schritt A ist jedoch nicht maximal, denn alle möglichen Werte £ lassen sich auch 
in der Frmb-+kh,mitb=1, h, = 2 darstellen. Die Bedingung dafür, daß 
ein Verteilungsschritt maximal ist, läßt sich auch noch anders ausdrücken. 


1. Ein Verteilungsschritt h ist dann und nur dann maximal, wenn der größte 
gemeinsame Teiler der paarweisen Differenzen aller möglichen Werte von & 
gleich A ist. 

2. Ein Verteilungsschritt hist dann und nur dann maximal, wenn der absolute 
Betrag der charakteristischen Funktion im Intervall 0 < || < = kleiner als 
Eins und für {= = gleich Eins ist. 

Letztere Behauptung ergibt sich sofort aus dem eben bewiesenen Hilfssatz. 
Ist nämlich für 0 <t,< a“ 


h 
/Wl=1, 
so muß nach dem Bewiesenen die Größen" ein Verteilungsschritt sein. Da aber 
2n 
h<— 
& 


ist, kann der Schritt h nicht maximal sein. 
Hieraus schließen wir: Ist h ein maximaler Verteilungsschritt, so läßt sich 
zu jedem e>0 eine Zahl c,> 0 finden derart, daß für alle f im Intervall 


e<ji< = — e die Ungleichung 


ol <e* 0) 
besteht. 
Es seien nun die Zufallsgrößen &,, &, . - - » &, . . . unabhängig und gitterförmig 
verteilt; sie mögen alle eine und dieselbe Verteilungsfunktion F(x) besitzen. 
Wir betrachten die Summe 


„ehtrktr ti: 


Offenbar ist auch diese eine gitterförmige Zufallsgröße, und ihre möglichen 
Werte lassen sich in der Form na-+kh aufschreiben. Wir bezeichnen mit 
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P,„(k) die Wahrscheinlichkeit der Gleichung 
„"=narkhb; 

insbesondere ist P,(k)=P{, =a+kh}=pı.- 
Wir setzen zur Abkürzung 
an+kh— A, 

Bun y 
wobei „= Mi, B=D4,=nD&,=no#8ist. 

Wir können nun den folgenden Satz beweisen, der offensichtlich den lokalen 

Grenzwertsatz von MoIVRE-LAPLa0E verallgemeinert. 


Zpk = 


Satz). Die unabhängigen gitterförmigen Zufallsgrößen 

FOR Se 
mögen ein und dieselbe Verteilungsfunktion F(x) besitzen, ihre. mathematische 
Erwartung und Dispersion sei endlich; dann besteht gleichmäßig bezüglich k 
(— o<k< oo) fürn — oodie Beziehung 

znk 
28 -g- 
Pk) — —e? —0, 
n(k) m: => 


dann und nur dann, wenn zn Verteilungsschritt h maximal ist. 


Beweis. Die Notwendigkeit der Bedingung des Satzes ist fast evident. Wenn 
nämlich der SCHFIRE h nicht maximal ist, dann besitzen die möglichen Werte der 


Summe (, = B5 &, systematische Lücken: Die Differenz zwischen zwei benach- 
k=1 


barten möglichen Werten der Summe kann nicht kleiner als d sein, wenn d der 
größte gemeinsame Teiler der Differenzen der möglichen Werte von £, ist. 
Wenn A kein maximaler Schritt ist, so ist d > h für alle Werte n. 

Etwas kompliziertere Überlegungen erfordert der Beweis, daß die Bedingung 
des Satzes auch hinreichend ist. 

Die charakteristische Funktion der Größe &, (k=1,2,3,...) ist gleich 


116) = Bi Pr ist Hitkh BE eiet 55 Pk eitkh 


k=—o k=—o 


die charakteristische Funktion der Summe {, ist 
oo 
P& — giant y P,(k) eitkh 
k=—o 
Multipliziert man die letzte Gleichung mit e!**!—it£% und integriert sie in 
den Grenzen von — bis n. ‚so findet man die Gleichung 
rn 


h 
n(k) pen [ro etant—itkh If, 


h 
1) Dieser Satz wurde von B. W. GnEDENKo bewiesen (Anm. d. Red.). 
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Wenn man beachtet, daß 
hk= BZ + An —an 


ist (anstelle von z„; wollen wir von nun ab nur noch z schreiben), so erhält man 
die Gleichung 


n 


"Pı(k) = [ Proc" 
— | 
wobei | 
it, 
ro=e * f@& 
gesetzt ist. Setzt man schließlich x—=tB,, so findet man 
nB 
E5 | 
2" Ba P,(h) = j ep (z)iz. 


Man rechnet leicht nach, daß 


ist. Wir stellen nun die Differenz 


= 
R,= 2 |? Pı(k) —n5t =] 
in Form einer Summe von vier Integralen 
R=hththth 


A zi 

ei en[ 7 \ 
[ee 

ge 
n-- [© 2 de, 

zl>4 

—_ —izz ganl Ü 

Ja f € 27 (z,) ®» 


n 


dar, mit 


eBn<kisTer 
re ezizz gen( ® j 
(7) 
A<Iz<eB, 


A > Osei dabei eine hinreichend große, e > 0 eine hinreichend kleine konstante 
Zahl, deren genauere Werte wir später wählen werden. 
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Auf Grund der Folgerung aus dem im vorigen Paragraphen bewiesenen Satz 
gilt gleichmäßig bezüglich { in jedem endlichen Intervall die Beziehung 


t ri 
nn | — 2 
f z)>: (n —oo). 
Hieraus folgt aber bei beliebigem konstanten A 
J, —>0 (n —o). 


Das Integral J, schätzt man mit Hilfe der Ungleichungen 
_: a u 
2 7 RE ER u 
= [e a<2 [20 dı=7e 
iel> 4A 
ab. Ist A hinreichend groß gewählt, läßt sich J, beliebig klein machen. 
Aus Ungleichung (1) erhalten wir 


“is [Ir 


RB, <l<@en 


" de <se"“2 35-0). 


Daraus folgt 
Js, —>0 (n oo). 


Zur Abschätzung des Integrals J, bemerken wir, daß die Existenz einer Dis- 
persion die Existenz der zweiten Ableitung der Funktion f*(f) nach sich zieht. 
Wir dürfen also in der Umgebung des Punktes {= 0 nach (3), $ 35, die Dar- 
stellung 


rO=1— + 00) 


benutzen, und für {| < e erhalten wir bei hinreichend kleinem e die Abschät- 


zung 
a 


242 —— 
Mol<ı-z<e t. 
Dann ist für |x| <e B, 


n 
ze tu =e + 


irn 
eBn © 


a 
MER il “di. 
4 4 


und schließlich 


Durch Wahl eines hinreichend großen A läßt es sich erreichen, daß das Integral 
J, beliebig klein wird. Der Satz ist damit bewiesen. 

Es gibt noch einen weiteren Fall, in dem man die Frage nach dem lokalen Ver- 
halten der Verteilungsfunktionen der Summen stellen kann. Dies ist der Fall 
der stetigen Verteilung. 
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Hier ergibt sich folgendes Problem: Wann konvergieren die Verteilungs- 
dichten der normierten Summen gegen die Dichte einer Normalverteilung, wenn 
die entsprechenden Verteilungsfunktionen gegen die Normalverteilung konver- 
gieren ? 


Diese Frage erhält in dem folgenden Satz eine erschöpfende Antwort. 
Satz. Die unabhängigen Zufallsgrößen 
En bares änen 


mögen ein und dieselbe Verteilungsfunktion F(x) besitzen; ihre mathematische 
Erwartung und Dispersion sei endlich, und von einem gewissen n, an besitze die 
Zufallsgröße 


1 S7@—M&) 


nD& = 


eine Verteilungsdichte p,(x). Es gilt genau dann gleichmäßig bezüglich «(— © < 
<xt<+oo) fürn — 0 


= 


Dice 
Pa) — m © 2—0, 


wenn es eine Zahl n, > 0 gibt derart, daß die Funktion p,,(x) beschränkt ist. 

Wir bringen hier nicht den Beweis dieses Satzes, da er im wesentlichen nur die 
soeben bereits durchgeführten Überlegungen wiederholt und sich auf die in der 
Bemerkung zur Aufgabe 2, Kap. 7, formulierten Sätze A und B stützt. 


Übungen 
1. Man beweise, daß für n — oo 


Yn* Hy 


Te 2_, _s 1 GR 
ari_ 2 2 ET Sr 2 
vrr( 3) j z e "k> Yan )° dz. 
0 —o 
Hinweis: Man wende den Satz von Lsarunow auf die y%-Verteilung an. 
2. Die Zufallsgrößen 
— n% mit der Wahrscheinlichkeit > 
+ n“ mit der Wahrscheinlichkeit = 


„= 


m 


seien unabhängig. Man beweise, daß für &« > — 3: auf sie der Satz von LJAPUNow 
anwendbar ist. 2 


3. Man beweise: 


nk 1 
en Mn fürn — mw. 
= 


Hinweis: Man benutze den Satz von Lsarunow und wende ihn auf das Poıssowsche 
Gesetz mita = lan. 


| 
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4. Die Wahrscheinlichkeit des Eintretens eines Ereignisses A im i-ten Versuch sei gleich p;, 


# die Anzahl des Eintretens des Ereignisses A in n unabhängigen Versuchen. Man 
beweise, daß 


oo 
dann und nur dann, wenn Y x 5; =». 
i=1 
5. Man beweise, daß unter den Bedingungen der vorigen Aufgabe die Forderung 
x 
Zpnu=+0 
i=1 


auch für den lokalen Grenzwertsatz hinreichend ist. 


IX, 


DIE THEORIE DER UNBESCHRÄNKT TEILBAREN 
VERTEILUNGSGESETZE 


Lange Zeit galt die Auffindung der allgemeinsten Bedingungen, unter denen 
die Verteilungsfunktionen von Summen unabhängiger Zufallsgrößen gegen 
das Normalgesetz konvergieren, als die zentrale Aufgabe der Wahrscheinlich- 
keitsrechnung. sehr allgemeine Bedingungen, die für diese Konvergenz hin- 
reichend sind, fand A. N. Lsarunow (siehe Kap. VIII). 

Die Versuche, die Bedingungen von LJAPUNOW zu erweitern, waren erst in 
den letzten Jahren von Erfolg gekrönt, als man die Bedingungen fand, die 
nicht nur hinreichend, sondern bei sehr naturgemäßen Beschränkungen auch 
notwendig sind. 

Parallel mit dem Abschluß der klassischen Problematik entstand und ent- 
wickelte sich eine neue Richtung in der Theorie der Grenzwertsätze für Summen 
unabhängiger Zufallsgrößen, die mit der Entstehung und der Entwicklung 
der Theorie des stochastischen Prozesses eng verknüpft ist. In erster Linie 
erhob sich die Frage, welche Gesetze, außer dem normalen, Grenzgesetze von 
Summen unabhängiger Zufallsgrößen sein können. 

Es zeigte sich, daß die Klasse der Grenzgesetze bei weitem nicht durch das 
Normalgesetz erschöpft wird. Man stellte sich daher die Aufgabe, Bedingungen 
zu finden, die man den Summanden auferlegen muß, damit die Verteilungs- 
funktionen der Summen gegen daseine oder das andere Grenzgesetz konvergieren. 

Ziel dieses Kapitels ist die Darlegung einiger Untersuchungen der letzten 
Jahre, die den Grenzwertsätzen für Summen unabhängiger Zufallsgrößen 
gewidmet sind. Dabei beschränken wir uns auf den Fall, daß die Summanden 
endliche Dispersionen besitzen. Ohne diese Beschränkung erfordert die Be- 
handlung dieser Aufgabe umständlichere Rechnungen; den Leser, der sich 
für die Lösung dieser Aufgabe interessiert, verweisen wir auf die zitierte Mono- 
graphie von GnEDEnko und KoLmoGororr. Als einfache Folgerung der dar- 
zulegenden allgemeinen Sätze erhalten wir die erwähnte notwendige und 
hinreichende Bedingung für die Konvergenz der Verteilungsfunktionen der 
Summen gegen das Normalgesetz. 


$ 44. Unbeschränkt teilbare Gesetze und ihre Haupteigenschaften 


Ein Verteilungsgesetz ®(x) heißt unbeschränkt teilbar, wenn sich für jede 
natürliche Zahl n eine nach dem Gesetz ®(x) verteilte Zufallsgröße als Summe 
von n unabhängigen Zufallsgrößen £&,, &, ... . , &, mit ein und demselben Vertei- 
lungsgesetz ®,(x) (das von der Anzahln der Summanden abhängt) darstellen läßt. 
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Diese Definition ist offensichtlich mit der folgenden gleichwertig: Ein Gesetz 
Ö(x) heißt unbeschränkt teilbar, wenn bei beliebigem n seine charakteristische 
Funktion die n-te Potenz einer anderen charakteristischen Funktion ist. 

Die Untersuchungen der letzten Jahre haben gezeigt, daß die unbeschränkt 
teilbaren Gesetze in verschiedenen Problemen der Wahrscheinlichkeitsrechnung 
eine wesentliche Rolle spielen. Insbesondere zeigt es sich, daß die Klasse der 
Grenzgesetze für Summen unabhängiger Zufallsgrößen mit der Klasse der un- 
beschränkt teilbaren Gesetze zusammenfällt. 

Wir kommen nun zur Darlegung der von uns für das folgende benötigten 
Eigenschaften der unbeschränkt teilbaren Gesetze. Wir beweisen zunächst, daß 
das normale und das Poıssoxsche Gesetz unbeschränkt teilbar ist. Die charak- 
teristische Funktion des Normalgesetzes mit der mathematischen Erwartung a 
und der Dispersion o? ist 
iat— lo 

old) = e ’ 
Bei beliebigem n ist die n-te Wurzel aus o(f) wieder die charakteristische 
Funktion eines Normalgesetzes, diesmal mit der mathematischen Erwartung rn 
und der Dispersion z : 


Wir wollen den uns früher begegneten Begriff des Poıssonschen Gesetzes 
etwas verallgemeinern und wollen sagen, eine Zufallsgröße sei nach dem Poıs- 
sonschen Gesctz verteilt, wenn sie nur die Werte a k -|- b mit reellen Konstan- 
ten a und b annehmen kann (k = 0,1,2,...) und wenn 


PfE=ak+b} =” 0) 


mit einer gewissen positiven Konstanten A ist. Die charakteristische Funktion 
des Gesetzes (1) ist, wie man leicht nachrechnet, durch die Formel 

ei) = een +id 
gegeben. Wir sehen, daß bei beliebigem n die n-te Wurzel aus off) wiederum 
die charakteristische Funktion eines Poıssonschen Gesetzes mit den Para- 


metern a, = und BB b ist. 
Rn N 


Satz 1. Die charakteristische Funktion eines unbeschränkt teilbaren Geserzes 
ist nirgends gleich 0. 


Beweis. Es sei ®(x) ein unbeschränkt teilbares Gesetz und. p(f) seine 
, charakteristische Funktion. Dann gilt nach Definition bei beliebigem n die 
Gleichung 


pl) = {pnld}" (2) 
mit einer gewissen charakteristischen Funktion 9,(f). Auf Grund der Stetigkeit 
der Funktion plf) gibt es einen Argumentbereich |!| <a, in dem g(f) #0 
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ist; natürlich ist in diesem Gebiet auch p,(f) # 0. Für hinreichend großes n 


unterscheidet sich die Größe |p„(f)| = Nrol gleichmäßig in £(|f| < a) beliebig 
wenig von Eins. 

Wir nehmen nun zwei unabhängige Zufallsgrößen 7, und 7, her, die nach 
irgendeinem Gesetz F(x) verteilt sind und betrachten ihre Differenz =, — ?2- 
Die charakteristische Funktion der Größe n ist gleich 


ro = M ei4m— m) FEN |M eitm 1 Yo]? . 
Wir sehen also, daß das Quadrat des absoluten Betrages einer beliebigen cha- 


rakteristischen Funktion wieder eine charakteristische Funktion ist. 
Da ferner jede reelle charakteristische Funktion die Gestalt 


f$ = f eosztdF(«) 
hat, gilt die Ungleichung 


1— f(2 1) = [ (1 — cos21) dF(x) 
=2/sintztdF(e)=2[(1—coszf)(1 + coszi)dF(a) 
<4f (1—coszd)dF@) =4(1— 0). 
Aus dem Gesagten ersehen wir, daß die Funktion |9,(£)|? der Ungleichung 
1— [29]? < 4 ll — Ink)? 
genügt. 
Aus dieser Ungleichung folgt: Wenn n so groß gewählt ist, daß 1 — |p,(f)| < e 
für |t| < a gilt, so ist in diesem Gebiet 
1— |M29| <1— md <td) SEA — AH) <Be- 
Damit haben wir im Gebiet |t| < 2 a die Abschätzung 


1— 9. )| <Be. 


Für hinreichend große n verschwindet also 9,(f) und damit auch g(f) nir- 
gends im Gebiet || < 2a. 

Ähnlich beweisen wir, daß g(f) # 0 auch im Gebiet |i| < 4a gilt usw. 
Damit ist unser Satz bewiesen. 


Satz2. Die Verteilungsfunktion einer Summe von unabhängigen Zufallsgrößen, 
die unbeschränkt teilbare Verteilungsfunktionen besitzen, ist ebenfalls unbeschränkt 
teilbar. 


Beweis. Offenbar kann man sich beim Beweis des Satzes auf den Fall 
zweier Summanden beschränken. Sind g(f) und y(f) die charakteristischen 
Funktionen der Summanden, so gilt auf Grund der Bedingung des Satzes für 
beliebiges n 


A Eee THE ZT) 
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wobei @,() und ,(f) charakteristische Funktionen sind. Daher genügt die 
charakteristische Funktion der Summe bei beliebigem n der Gleichung 
x) = PU) ve = {Pal * YO)" - 


Satz 3. Eine Verteilungsfunktion, die Grenzwert (im Sinne der Konvergenz 
im wesentlichen) einer Folge unbeschränkt teilbarer Verteilungsfunktionen ist, ist 
selbst unbeschränkt teilbar. 


Beweis. Eine Folge ©%) unbeschränkt teilbarer Verteilungsfunktionen 
konvergiere im wesentlichen gegen die Verteilungsfunktion ®(x). Dann ist 
lim g%d) = pl) (3) 
k>oo 


gleichmäßig in jedem endlichen Intervall {. Nach der Bedingung des Satzes 
sind bei beliebigem n die Funktionen 


2 —— 

OF) (4) 

(unter Vist der Hauptwert zu verstehen) charakteristische Funktionen. Aus 
(3) schließen wir, daß für jedes n die Beziehung 

lim a0 = Full) (6) 


besteht. Aus der Stetigkeit von gt) folgt die Stetigkeit von 9,(f). Auf Grund 
des Grenzwertsatzes für charakteristische Funktionen ist 9,(f) eine charak- 
teristische Funktion. Aus (3), (4) und (5) finden wir, daß für jedes n die Glei- 


chung 
el) = {pn(d}” 
besteht, was zu beweisen war. 


$ 45. Kanonische Darstellung der unbeschränkt teilbaren Gesetze 


Im folgenden beschränken wir uns auf die Untersuchung unbeschränkt teil- 
barer Gesetze mit endlicher Dispersion. Ziel dieses Paragraphen ist der Be- 
weis des folgenden im Jahre 1932 von A. N. KoLMmoGoroFF gefundenen Satzes, 
der eine vollständige Charakterisierung der uns interessierenden Klasse von 
Verteilungsgesetzen gibt. 


Satz. Eine Verteilungsfunktion ®(x) mit endlicher Dispersion ist dann und 
nur dann unbeschränkt teilbar, wenn der Logarithmus ihrer charakteristischen 
Funktion die Gestalt 


logpll) = iyt+ ffet* —1 —i12}4.d6() () 
hat; y bezeichnet dabei eine reelle Konstante und G(x) eine nicht abnehmende Funk- 
tion mit beschränkter Variation. 


Beweis. Wir setzen zunächst voraus, daß ®(x) ein unbeschränkt teilbares 
Gesetz und p(f) seine charakteristische Funktion sei. Dann ist bei beliebigem n 


ed) = {pn(d}" 
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mit einer gewissen charakteristischen Funktion g,(f). Da g(f) 0 ist, ist diese 
Gleichung mit der folgenden äquivalent: 
log pÜ) = n log pu(d) = nlog [1 + (ul) — D] ) 
Bei beliebigem T gilt für n — oo gleichmäßig im Intervall |t|< T die Be- 
ziehung 
Put) >1, 
daher läßt sich in jedem beliebigen endlichen Werteintervall von ? die Größe 
|9»( — 1| kleiner als jede vorgegebene Zahl machen, wenn nur n hinreichend 
groß ist. Wir dürfen also die Gleichung 
log [1 + (9) — 1] = ad — 1) (1 + o(1)) 

benutzen, mit deren Hilfe wir die Beziehung 

log pt) = lim n(p,() — 1) = lim n f (e'* — 1) d®,(&) (2) 

N n—co 


erhalten; dabei bezeichnet ®,(z) die Verteilungsfunktion, deren charakteristische 
Funktion 9,(f) ist. Aus der Definition der mathematischen Erwartung folgt 
in Verbindung mit der Beziehung zwischen Ö,(x) und ®(z) die Gleichung 


nfxd®,(x) = f zdd(e). 
Wir bezeichnen diese Größe mit y; dann läßt sich die Gleichung (2) folgender- 
maßen schreiben: 
log pl) =iyt-+ lim nf {e'®—1 — itz} dD,de). 
Nn>00 
Wir setzen jetzt 
G,(&) =n/f u2dd,(u). 
—o 


Die Funktionen G,(x) nehmen offensichtlich mit wachsendem Argument nicht 
ab, und es ist G6,(— oo) = 0. Außerdem sind die Funktionen G,„(t) gleichmäßig 
beschränkt. Letztere Behauptung folgt aus der Eigenschaft der Dispersion 
und aus dem Zusammenhang zwischen den Funktionen (x) und ©,(e). Es 
ist nämlich 


G(+ 0) = n | urdo,(u) 
| u: dö,(u) -( | u 10,0) +n ( [ u 10,0) =a+4lp, @ 


wobei o? die Dispersion des Gesetzes ®(x) bezeichnet. 
In den neuen Bezeichnungen ist (siehe die Eigenschaft 6 des STIELTJES- 
Integrals in $ 25) 


log p(l) =iyt + lim Jer1-i119446,6). 
Nn>00 


=n 


2) Der Logarithmus ist hier im Sinne des Hauptwertes zu verstehen. 
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Auf Grund des ersten HzLıyschen Satzes läßt sich aus der Folge der Funk- 
tionen G,(x) eine Teilfolge herausgreifen, die gegen eine gewisse Grenzfunktion 
G(x) konvergiert. Sind A < 0 und B > 0 Stetigkeitsstellen der Funktion G(x) , 
so gilt auf Grund des zweiten HeLLyschen Satzes für k — oo 

B 


B 
fe 1— i 12) 4. dG,,(e) + [ee — 1 —it2)4.d6@) . (4) 
Ä Ä 
Wir wissen, daß 

je —1—itz]l<je®— 1] + ta] <|tz| + |tx| = 2]t|- |e] 
ist, und daher ist 


A oo 
[+ [er- 1—i12)4dG,,) 
B 


2 A © A © 
1 2 Il 2: Br 
<2jt ( N * = 6,0) < ziel + | 10.6) < max. face. 


mit I'= min (|A|, B). Da die Variationen der Funktionen G,,(u) gleichmäßig 
beschränkt sind, kann man es bei beliebig vorgegebenem e > 0 erreichen, daß 
die Ungleichung 


4A a ” - 
<a, 
—-m@o BB 


A oo 
[+ [er—1—-i12) 446,6) ze (5) 
er} B 


für alle in einem beliebigen endlichen Intervall gelegenen Werte { und für 
alle & erfüllt ist. Man braucht nur A und B genügend groß zu wählen. 

Aus (4) und (5) folgt, daß bei beliebigem & > 0 für alle ? aus einem beliebigen 
endlichen Intervall für hinreichend große k die Ungleichung 


; . 1 ; . N: 
jer-1 — 12) 4.46) — [ (er —1— 129) 4.d6K) 
besteht, das heißt mit anderen Worten, es gilt die Beziehung 

’ i 1 ; | 
lim | (d* —1— it 2) = 26n,(@) = j (et —1— il 2) „ d6(e) ; 


k>o0 
Wir haben auf diese Weise bewiesen, daß der Logarithmus der charakteristischen 
Funktion eines beliebigen unbeschränkt teilbaren Gesetzes sich in der Form (1) 
schreiben läßt. Uns verbleibt nun noch der Beweis der umgekehrten Behaup- 
tung, daß jede Funktion, deren Logarithmus sich in der Form (1) darstellen 
läßt, die charakteristische Funktion eines unbeschränkt teilbaren Gesetzes ist. 
Bei beliebigem e (0 < e < 1) ist das Integral 
1 


<eE 


jer- 1—it2) 4dGke) (6) 
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nach Definition des SrIeLtses-Integrals der Grenzwert von Summen 


Der 1— 1) dd). 


s-1 


wobei 4 = &, Zu4ı =Z ‚u <Z,< 2; und max (%,,, —u)—>0. Jeder 


Summand in dieser Summe ist der Logarithmus der charakteristischen Funktion 
eines Porssonschen Gesetzes. Auf Grund der Sätze 2 und 3 ist das Integral (6) 
der Logarithmus der charakteristischen Funktion eines unbeschränkt teilbaren 
Gesetzes. Wenn wir für e—0 zum Grenzwert übergehen, so überzeugen wir 
uns davon, daß das gleiche auch für das Integral 


(ee _1—it 2)4.dG(e) (7) 
«>0 
zutrifft. Analog beweisen wir, daß auch das Integral 


(et —1— i 12). d6ke) (8) 
z<o 
der Logarithmus der charakteristischen Funktion eines unbeschränkt teilbaren 
Gesetzes ist. Das Integral auf der rechten Seite der Formel (1) ist gleich der 
Summe der Integrale (7) und (8) und der Größe 


iyt—zB(6(+) 6A): 


Der letzte Summand ist der Logarithmus der charakteristischen Funktion eines 

Normalgesetzes. Aus Satz 2, $44, folgt, daß jede in der Form (1) darstellbare 

Funktion p(f) die charakteristische Funktion eines unbeschränkt teilbaren :Ge- 

setzes ist.!) Wir müssen uns nun nur noch davon überzeugen, daß die Dar- 

stellung von log pff) durch die Formel (1) eindeutig ist, d.h. daß die Funk- 

tion G(x) und die Konstante y durch Vorgabe von o(f) eindeutig bestimmt sind. 
Durch Differentiation der Formel (1) finden wir 


S log plt) = — | etz dG(e). (9) 


Aus der Theorie der charakteristischen Funktionen wissen wir, daß die 
Funktion G(x) in dieser Formel eindeutig durch log y(f) bestimmt ist. 


Im Verlauf des Beweises sehen wir, daß die Konstante y die mathematische 
Erwartung ist und damit ebenfalls eindeutig durch die Funktion p(f) bestimmt 
ist. 


ı) Wir haben soeben bewiesen, daß jedes unbeschränkt teilbare Gesetz entweder die 
Faltung endlich vieler Poıssowscher oder normaler Gesetze oder Grenzwert einer gleich- 
mäßig konvergenten Folge solcher Gesetze ist. Wir sehen also, daß die normalen und die 
Poıssoxschen Gesetze die Hauptelemente sind, aus denen jedes unbeschränkt teilbare 
Gesetz zusammengesetzt ist. 
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Zum Schluß notieren wir die wahrscheinlichkeitstheoretische Bedeutung der 
Totalvariation der Funktion G(z). Wir wissen: Wenn eine Zufallsgröße £ nach 
einem Gesetz ®(x) verteilt ist, so ist (siehe (5), $ 35) 


De — lo]; 
folglich ergibt sich aus (9) die Beziehung 
De=[d6@)=G(+ ©). 
Als Beispiel führen wir die kanonische Darstellung des Normalgesetzes und 
des Poıssoxschen Gesetzes an. 


Fiir das Normalgesetz mit der Dispersion s® und der mathematischen Er- 
wartung a gilt 
gap! 0 fürr<oO, 
o°: für 2>0. 


Diese Funktion und die Konstante y führen wieder auf das gegebene Gesetz, 
denn es ist 
1 1 it ER Tsliaierel ui Lä ae 

[er 1-12} 2a6@) = 1m "164 —001= 
und auf Grund der Eindeutigkeit der kanonischen Darstellung können keine 
anderen Funktionen G(x) das Normalgesetz ergeben. 

Ähnlich überzeugt man sich leicht davon, daß dem Poıssonschen Gesetz 
mit der charakteristischen Funktion 


y=a und 6“ -| 


pl) = ia 1) +idt 


eine Funktion G(x) mit einem einzigen Sprung an der Stelle a entspricht 


_ [9 für <a, 
=, für >a 
undy=b-+a4. 
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Wenn eine Folge unbeschränkt teilbarer Verteilungsgesetze gegen ein. Grenz- 
verteilungsgesetz strebt, so ist, wie wir bereits wissen, dieses Grenzgesetz selbst 
unbeschränkt teilbar. Wir geben nun Bedingungen dafür an, unter denen 
eine vorgelegte Folge unbeschränkt teilbarer Verteilungsfunktionen gegen eine 
Grenzverteilungsfunktion strebt. 

Satz. Notwendig und hinreichend dafür, daß eine Folge. {9,@)} unbeschränkt 
teilbarer Verteilungsfunklionen für n —oo gegen eine Verteilungsfunktion ®(x) 
konvergiert und ihre Dispersionen gegen die Dispersion des Grenzgesetzes konver- 
gieren, ist die Existenz einer Konstante y und einer Funktion G(x), so daß für n —oo 

1. G„(&) im wesentlichen gegen G(x) konvergiert, 

2. G,(00) — G,(— ©0) — G(co) — G(— oo), 

3. my: 

18 Gnedenko 
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y„ und G,(x) sind dabei durch die Formel (1), $45, für das Gesetz ®,(x) gegeben, 
die Konstantey und die Funktion G(x) bestimmen nach derselben Formel das 
Grenzgesetz ®(x). 


Beweis. Die Bedingungen des Satzes sind hinreichend: Dies ist eine direkte 
Folgerung des zweiten Hryschen Satzes. Aus den Bedingungen des Satzes 
und aus Formel (1), $ 45, folgt nämlich, daß für n — 00 


log pu(l) > log pl) 
gleichmäßig in jedem endlichen Intervall von t. 
Im vorigen Paragraphen sahen wir, daß die Integrale 
S dG,(u) und JS dG(u) 


gleich den Dispersionen der Gesetze ®,(x) und ©(x) sind; die zweite Bedingung 
des Satzes ist daher nichts anderes, als die Forderung nach der Konvergenz 
der Dispersionen. 


Es sei nun bekannt, daß für n — oo 
B,(&) > ©) (1) 


strebt und daß die Dispersion der Gesetze D,(x) gegen die Dispersion des 
Grenzgesetzes ®(x) konvergieren. Wir beweisen, daß dann die Bedingungen 
des Satzes erfüllt sind. Bezüglich der Bedingung 2 erfordert dies keine zusätz- 
lichen Überlegungen, wie wir eben bemerkten. Hieraus folgt, daß die Total- 
variationen der Funktionen G,(x) gleichmäßig beschränkt sind. Wir können also 
den ersten Hrıtyschen Satz benutzen und aus der Folge der Funktionen G,(u) 
eine Teilfolge G„,(u) auswählen, die für k — oo gegen irgendeine Grenzfunktion 


G,„(u) konvergiert. Unser Ziel ist nun der Beweis der Gleichung 
G.„(u) = G(u) . 
Dazu stellen wir zunächst fest, daß die Konvergenz 
; ; 1 ; . 1 
J. = = 1—il ul: dG„,(u) > Io = [te —l1-—it u}; dG(u) (2) 
für k— oo statt hat. Es seien A< 0 und B> 0 Stetigkeitsstellen der Funk- 


tion G„(u); dann gilt nach dem zweiten Hzuzyschen Satz für k— oo die 
Beziehung 


B B 
ea > (er—1—ita} ZIG). ) 
4 


Andererseits ersehen wir aus der Ungleichung 


l®®—1—ital<2jtal, 


$46. Ein Grenzwertsatz für unbeschränkt teilbare Gesetze 261 


daß 


<2jt 


A oo 
itu . 1 
= [+ [te —1—itu}z dG,(u) 
— 00 B 
2 


ll [+ 1 RO) <?E [ a6,,(u) 


B 
ist mit /'= min (— A, B). Da die Variationen der Funktionen G,„(u) gleich- 
mäßig beschränkt sind, kann man bei beliebigem e> 0 dem Betrag nach 
genügend große A und B so wählen, daß die Ungleichung 

L,<e (4) 


erfüllt ist. Ebenso gilt bei beliebigem e > 0 für dem Betrage nach hinreichend 
große A und B die Ungleichung 
A 


[+ [er-1- 400.0 
B 


— co 


Aus den Beziehungen (3), (4) und (5) schließen wir, daß bei beliebigem e > 0 
für hinreichend größe Werte k 


Ye Jo| <3e 


ist. Die Beziehung (2) ist damit bewiesen. 
Aus (I) folgt 


lim log g,(l) — lim ( mit j {ee —1 — tu) 546) 


= log pl) =i yt+ [er —1- iu %acaı), 


<e. (5) 


oder 
im (i Ya; + j {fe —1—itu} . dG,,) 


k>o 
” 07 ” 1 
=iy+ [er —ı1—itu} 2, dc). (6) 
Aus der Ungleichung 
er —_1-—-itul<” 


und der gleichmäßigen Beschränktheit der Totalvariationen der Funktionen 
G„,(u) schließen wir, daß für £ — 0 gleichmäßig in n die Beziehung 


R ’ I; 
fe w—_1— iu) 2, d6,,(u) I<It [ a6,,w +0 
besteht. (6) ergibt daher für 1—0 die Beziehung 
!im 1 (7) 
k>o0 


18* 
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und andererseits ist nach (2) und (7) 
log pl) =iyt+ j fer —1—iul} Zi). 


Da die Darstellung der unbeschränkt teilbaren Gesetze mit Hilfe der Formel (1), 
$ 44, eindeutig ist, folgt G.(u) = G(u). Jede beliebige konvergente Teilfolge 
von Funktionen G,„,(u) konvergiert also gegen die Funktion G(u), und gleich- 
zeitig konvergieren die Konstanten y,„, gegen y. Man kann nun leicht beweisen, 


daß die ganze Folge G,(u) ebenfalls gegen G(u) konvergiert, und daß gleich- 
zeitig ir Am y„=y ist. Wäre dies nicht so, so ließe sich eine Stetigkeitsstelle 


der Fünktionen G(u) finden — wir wollen sie c nennen — und eine Teilfolge 
von Funktionen G,,(u) auswählen, die im Punkt u = c für k — oo gegen eine 


von G(c) verschiedene Zahl konvergiert. Nach dem ersten HeLıyschen Satz 
können wir aus dieser Teilfolge eine konvergente Teilfolge G,, (u) auswählen. 
r 


Aus dem vorigen folgt, daß in allen Stetigkeitsstellen von G(u) 
lim G, ,() = G(u) 
1>09 
ist. Dies widerspricht unserer Annahme. Folglich ist in allen Stetigkeitsstellen 


der Funktion G(u) 
au 1.6) = G(u); 


wie wir sahen, folgt hieraus sofort die Beziehung 
limy,=y. 
n>X 

Der Satz ist damit bewiesen. 


$ 47. Aufgabenstellung für die Grenzwertsätze für Summen 
Gegeben sei eine Folge von Serien 
Eu» Es ... ‚Ein > 
Ent s Eos » ... eo 


ee (1) 


von in jeder Serie unabhängigen Zufallsgrößen. Gefragt ist, gegen welche 
Grenzverteilungsfunktionen die Verteilungsfunktionen der Summen 


m Ent int‘ t um 


für n — oo streben können und welche Bedingungen es für diese Konvergenz 
gibt. 
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Des weiteren beschränken wir uns auf die Untersuchung elementarer 
Systeme, d.h. auf Folgen von Serien (1), für die folgende Bedingungen erfüllt 
sind: 


1. Die Größen £,, besitzen endliche Dispersionen, 


2. die Dispersionen der Summen Z, sind durch eine von n nicht abhängende 
Konstante C beschränkt, 


3. m) = max D&,, —>0 fürn — oo. 
1<k<kn 
Die letzte Forderung besagt, daß der Einfluß der einzelnen Summanden 
auf die Summe mit wachsendem n immer kleiner werden soll. 
Die von uns früher betrachteten Grenzwertsätze für Summen genügen offen- 
bar diesen Bedingungen. So hatten wir in den Sätzen von MoIvRE-LAPrLACE 
und LsArunow die Folge von Serien 


En Eng a Eu 


mit 
u. Me (I<k<n,n=1,2...) 
n 
Vzo% 
k=1 


In den Sätzen von BERNOULLI, TSCHEBYSCHEW und MARKOW über das Gesetz 
der großen Zahlen hatten wir es auch mit einer Folge von Serien zu tun, in denen 
für &,, die Größen 
_&—M& 
ae eanes 
n 
angesetzt waren. 


$ 48. Grenzwertsätze für Summen 


Gegeben sei ein elementares System; wir bezeichnen mit F,,(@) die Ver- 
teilungsfunktion der Zufallsgröße &,, und mit F„.(&) die Verteilungsfunktion 
der Größe &,: = &, — M &,,; offenbar ist 


Fy+@) Ze Furl +M En) - 
Satz 1. Die Verteilungsfunktionen der Summen 
En — En + Eng +++ uk, (1) 


konvergieren dann und nur dann für n — 00 gegen eine Grenzverteilungsfunklion, 
wenn unbeschränkt teilbare Gesetze, deren Logarithmen ihrer charakteristischen 
Funktionen durch die Formel 


ku _ 
vl) = Ef ME + Se — Dre} 6) 
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definiert sind, gegen ein Grenzgeselz streben.‘) Die Grenzgeselze beider Folgen 
sind identisch. 


Beweis. Die charakteristische Funktion der Summe (1) ist gleich 


kn 
it Menk kn 


En 2 = 
WO=Hfa et ml), 16) 
k=1 k=1 


dabei bezeichnet /„.(£) die charakteristische Funktion der Zufallsgröße £,, und 
fnr(f) die charakteristische Funktion der Größe £,;- 

Wir wissen, daß die Verteilungsfunktionen der Summen (1) dann und nur 
dann gegen eine Grenzfunktion ®(x) konvergieren, wenn für n — 00 die Funk- 
tionen /„() gegen eine stetige Funktion p(f) konvergieren; p(f) ist dann die 
charakteristische Funktion des Gesetzes ®(x). 

Wir setzen 


= —1. 


Für die Größen «,; gilt gleichmäßig in jedem endlichen Intervall von £ die 
Beziehung 
&%, = max |a,,| 0. (4) 
1<k<k, 
Es ist nämlich 


On = (et? — 1) dF use) — f (et — 1 —ita)dF,@), 
weil 
M En: = fzdF,.() =(. 
Wir wissen, daß für alle reellen « die Abschätzung 
[3 
lee —1—ial =y 
besteht; daher ist auch 
[44 — 2 
az [A = 5 Dim 6) 
Aus (5) und aus der dritten Bedingung für elementare Systeme folgt (4). 


ı) Führt man die Bezeichnungen 
k 


n Mu _ 
Yn= 3 M&nr; Gau) = % S dFur) 
k=1 k=1—o 
ein und beachtet, daß f zdF'„,(z) = 0 ist, so kann man die Funktionen y,„(f) in der Form 
ynl) = öymt ts tet 1 irn) I done) 
u 


schreiben. Wie wir wissen, besagt dies, daß y,(t) der Logarithmus der charakteristischen 
Funktion eines unbeschränkt teilbaren Gesetzes ist. 

Wir bemerken, daß die Dispersionen von [,„ und der unbeschränkt teilbaren Gesetze (2) 
zusammenfallen. 


848. Grenzwertsätze für Summen 265 


Aus (4) schließen wir vor allem, daß bei beliebigen T für hinreichend große 
n und alle || < 7 die Abschätzung 


m] <z (6) 
besteht. Daher können wir die Entwicklung 
108 Inu) = 10g (1 + One) = an at + 
ansetzen. Offenbar ist 
R, = |log 1 dc ME + &n2) 
k=1 
& 7 en S lanı)? Sr, 
= | >, (08 Ind — ans) LER er 9 


Die Formeln (5) und (6) führen uns auf die Ungleichung 
R,< Garen al Sl < 2 z Omar | [&nx] - 


Auf Grund von (4) schließen wir, daß gleichmäßig in jedem endlichen Inter- 
vall von 2 für n — oo die Konvergenz 


|log In(t) — Yalt)| +— & 


statthat. 

Damit haben wir nachgewiesen, daß sich in jedem elementaren System die 
Verteilungsfunktionen der Summen £, und die unbeschränkt teilbaren Verteilungs- 
[unktionen, die durch die Formel (2) definiert sind, für n — oo unbeschränkt 
nähern; damit ist der Satz 1 bewiesen. 

Dieser Satz gestattet es, die Untersuchung der Summen (1) von Zufalls- 
größen mit im allgemeinen beliebigen Verteilungsfunktionen durch die Unter- 
suchung unbeschränkt teilbarer Gesetze zu ersetzen. Letzteres erweist sich — 
wie wir sehen werden — in vielen Fällen als äußerst einfach. 


Satz 2. Jedes Verleilungsgeselz, das sich als Grenzgeseiz von Verteilungs- 
/unktionen von Summen eines elementaren Systems ergibt, ist unbeschränkt teil- 
bar und besitzt eine endliche Dispersion, umgekehrt ist jedes unbeschränkt teil- 
bare Gesetz mit endlicher Dispersion ein Grenzgesetz für die Verteilungsfunktionen 
der Summen eines gewissen elementaren Systems. 


Beweis. Aus dem vorigen Satz wissen wir, daß das Grenzgesetz von Ver- 
teilungsfunktionen der Summen (1) ein Grenzgesetz unbeschränkt teilbarer 
Gesetze und nach Satz 3, $44, unbeschränkt teilbar ist; seine Dispersion ist 
endlich, da die Dispersionen der Summen nach der zweiten Bedingung für 
elementare Systeme gleichmäßig beschränkt sind. Die umgekehrte Aussage, 
daß jedes unbeschränkt teilbare Gesetz mit einer endlichen Dispersion Grenz- 


266 IX. Die Theorie der unbeschränkt teilbaren Verteilungsgesetze 


gesetz von Summen ist, ergibt sich direkt aus der Definition der unbeschränkt 
teilbaren Gesetze. 


Satz 3. Notwendig und hinreichend dafür, daß die Verteilungsfunktionen von 
Summen (1) für n — oogegen irgendeine Grenzverleilungsfunktion konvergieren 
und ihre Dispersionen gegen die Dispersion dieses Grenzgesetzes konvergieren, 
ist die Existenz einer Funktion G(u) und einer Konstante y, so daß für n — oo 

k 


1. 2 [ @dFua) GC) 
k=1—o 


in allen Stetigkeitsstellen der Funktion G(u) , 


kn _ 
2. : & fa" dF,.) >G(+ ©), 
—=1 


En 
». >; [x dF,,(&) >y. 
k=1 


Der Logarithmus der charakteristischen Funktion des Grenzgeseizes ist durch 
die Formel (1), $ 45, mit der eben bestimmten Funktion G(u) und der Konstanten y 
definiert. 

Beweis. Wenn wir die Bezeichnungen 


kn u — 
G)=% f zdF,&) 
und Bel 


kn 
Yan = fx dF,.&) 
k=1 


einführen, so erhalten wir die Bedingungen des Satzes aus $46. Der Satz ist 
damit bewiesen. 

Wenn wir die Formulierung des letzten Satzes etwas abändern, so können 
wir außer den Bedingungen für die Existenz eines Grenzgeseizes auch Be- 
dingungen der Konvergenz gegen jedes vorgegebene Grenzgesetz gewinnen. 


Satz 4. Nolwendig und hinreichend dafür, daß die Verteilungsfunktionen der 
Summen (1) fürn — oo gegen eine vorgelegte Verteilungsfunktion ®(x) konvergieren 
und die Dispersionen der Summen gegen die Dispersion des Grenzgesetzes konver- 
gieren, sind die folgenden Limesbeziehungen (n — ©): 

k 


n u = 
1. 5 f x"dF,a) >G(u) 
k=l—o 


in den Stetigkeitsstellen der Funktion G(u) , 
ku — 
2. I f[z"dF,.(2) >G(), 
k=1 


kn 
3. I [adFu@)>y. 
k-1 


Die Funktion G(u) und die Konstante y sind dabei durch die Formel (1), $ 45, 
für die Funktion ®(x) bestimmt. 
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8 49. Bedingungen für die Konvergenz gegen das normale 
und das Poıssonsche Gesetz 


Die Ergebnisse des vorigen Paragraphen wenden wir nun zur Ableitung von 
Bedingungen an, unter denen die Verteilungsfunktionen von Summen gegen 
das normale und das Poıssonsche Gesetz konvergieren. 


Satz 1. Gegeben sei ein elemeniares System unabhängiger Zufallsgrößen. Die 
Verteilungsfunktionen der Summen 


mn Ent nat: + Emm, (1) 


konvergieren für n — oo dann und nur dann gegen das Gesetz 
z 


1 e.. 
DE = f: 2 de, 


wenn für n — oo die folgenden Bedingungen erfüllt sind: 


oo 


Ku 
1. Z[xdF,a) 0, 


k=1 
kn = 
2.52 [du >0, 
k=1je]>r 


k,, — 
3.52 [ du) >1; 


k=1le]<r 
r ist dabei eine beliebige positive Konstante. 
Beweis. Aus Satz 4, $ 48, folgt, daß für n — oodie Beziehungen 


k, 
ZSzdF..) >0, 
k=1 


kn u &- 

EZ S[wdFu@) > 
k=1-—0 

k 


Ef dR,.a) >1 
k=1 


2 für u<O, 
1 füru>0, 


erfüllt sein müssen. Die erste von ihnen ist mit der ersten Bedingung des 
Satzes identisch, die Gleichwertigkeit der beiden übrigen mit der zweiten und 
dritten Bedingung des Satzes ist evident. 

Eine besonders einfache Form nimmt dieser Satz an, wenn das betrachtete 
elementare System von vornherein durch die Bedingungen 


ku 
Z/dF.)=1, 
k=1 
[x dF,+(«) = 0 (I\<sk<sk; n=1,23.:.,4) (2) 
normiert ist. 
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Satz 2. Wenn ein elementares System durch die Beziehungen (2) normiert 
ist, so ist für die Konvergenz der Verteilungsfunktionen der Summen (1) gegen 
das Normalgesetz notwendig und hinreichend, daß für alle r>0 fürn—w 
die Beziehung E 


n 
ES dF.a) 0 (3) 
besteht. bei Bl>r 

Der Beweis des Satzes ist evident. 

Die Forderung (3) nennt man die Liwpmserasche Bedingung, da LiNDEBERG 
im Jahre 1923 bewies, daß sie für die Konvergenz der Verteilungsfunktionen 
von Summen gegen das Normalgesetz hinreichend ist. 1935 bewies W. FELLER 
die Notwendigkeit dieser Bedingungen. 

Als weiteres Beispiel der Anwendung der allgemeinen Sätze des vorigen 
Paragraphen betrachten wir die Konvergenz der Verteilungsfunktionen elemen- 
tarer Systeme gegen das Poıssoxsche Gesetz 


0 für e<0, 
Pl) = De (4) 
> e > für 2>0. 
0<k<z 


Ist & eine nach dem Gesetz (4) verteilte Zufallsgröße, so ist, wie wir bereits 
wissen, ME=-DE=4}. 
Wir beschränken uns auf elementare Systeme, für die 
k 


n 
B; ME, >, 
k=1 


. 6) 
3 D Enz A 
k=1 


gilt. 


Satz 3. Gegeben sei ein elementares System, das den Bedingungen (5) unter- 
worfen ist. Die Verteilungsfunklionen der Summen 


m Ent &nat "+ Enn, 


konvergieren genau dann gegen das Geselz (4), wenn bei beliebigem >O die 


Beziehung 
k 


n 
Sf z@dFyx(® + ME) >0 (n — oo) 
k=1|2—1l>r 
besteht. 

Den Beweis dieses Satzes überlassen wir dem Leser. 

In $15 haben wir den Satz von Poıssow bewiesen. Man überzeugt sich 
leicht davon, daß er für np, —=4 ein Spezialfall des eben bewiesenen Satzes 
ist. Sei nämlich &,,(1 <k<n) eine Zufallsgröße, die die Werte 0 oder 1 
annimmt, je nachdem ob beim k-ten Versuch der n-ten Serie das von uns 
beobachtete Ereignis A eintritt oder nicht. Dabei ist 


Piu=1} -. und Pfeu=0}= 1—L. 
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Offenbar stellt die Summe 
Kin Enıt int" + Inn 
die Anzahl des Eintretens des Ereignisses A in der n-ten Versuchsserie dar. 

Nach dem Poıssonschen Satz konvergieren die Verteilungsfunktionen der 
Größen u, für n — oogegen das Poıssonsche Gesetz (4). Dieses Resultat folgt 
auch aus dem soeben formulierten Satz, da alle seine Forderungen im vorlie- 
genden Falle erfüllt sind. 

Die allgemeinen Sätze über die Annäherung der Verteilungsfunktionen der 
Summen (1) an gewisse unbeschränkt teilbare Verteilungsfunktionen, die unter 
viel allgemeineren Voraussetzungen als bei uns bewiesen werden, gestatten es, 
auch eine notwendige und hinreichende Bedingung für das Gesetz der großen 
Zahlen (im Falle unabhängiger Summanden) zu gewinnen. Siehe darüber die 
bereits erwähnte Monographie von W. B. GnEDENko und A. N. KOLMOGOROFF. 


Übungen 


1. Man beweise, daß die folgenden Verteilungen unbeschränkt teilbar sind: 
a) die Pascausche Verteilung (Übungsaufgabe la, Kapitel 5), 
b) die PoLyasche Verteilung (Übungsaufgabe 1 b, Kapitel 5), 
c) die CaucHysche Verteilung (Beispiel 5, $ 24). 


2. Man beweise, daß eine Zufallsgröße mit der Verteilungsdichte 


0 für <0, 
rn x 
Pa le ze—1e-Bz fürz>0, 


Ic) 
(x >0 und $ > 0 sind dabei Konstanten) unbeschränkt teilbar ist. 
Anmerkung. Hieraus folgt insbesondere, daß die MaxweLısche Verteilung und die 
x°-Verteilung (bei beliebigem rn) unbeschränkt teilbar sind. 
3. Man beweise, daß bei beliebigen Konstanten «> 0 und? >0 


i? \—a 
gt) = (1 ee 
die charakteristische Funktion einer unbeschränkt teilbaren Verteilung ist. 
Anmerkung. Hieraus folgt insbesondere, daß die LarLaczsche Verteilung unbe- 
schränkt teilbar ist. 


4. Man bestimme die Funktion @(x) und den Parameter y in der Korcomororrschen 
Formel für den Logarithmus einer unbeschränkt teilbaren charakteristischen Funktion 
für die 
a) Verteilung der Aufgabe 2, 

b) LartLaonsche Verteilung. 


5. Man beweise: Wenn die Summe zweier unabhängigen unbeschränkt teilbaren Zufalls- 
größen 
a) nach dem Poıssoxschen Gesetz, 
b) nach dem Normalgesetz 
verteilt ist, so ist jeder Summand im Fall a) nach dem Poıssowschen Gesetz und im 
Fall b) nach dem Normalgesetz verteilt. 

6. Man stelle die Bedingungen dafür auf, daß die Verteilungsfunktionen von Summen von _ 
Zufallsgrößen, die ein elementares System bilden, 
a) gegen die Verteilung der Aufgabe 2, 
b) gegen die Larraczsche Verteilung 

konvergieren. 


X. 


DIE THEORIE DER STOCHASTISCHEN PROZESSE 


$ 50. Einleitende Bemerkungen 


Die Vervollkommnung der physikalischen Statistik sowie eine Reihe von 
Gebieten der Technik stellten der Wahrscheinlichkeitsrechnung eine große 
Anzahl neuer Aufgaben, die nicht in den Rahmen der klassischen Theorie fallen. 
Während die Physik und die Technik die Untersuchung von Prozessen inter- 
essierte, d. h. die Untersuchung von Erscheinungen, die mit der Zeit ablaufen, 
besaß die Wahrscheinlichkeitsrechnung weder allgemeine Verfahren, noch aus- 
gearbeitete spezielle Schemen zur Lösung von Aufgaben, die sich bei der 
Untersuchung solcher Erscheinungen ergeben. Es entstand die dringende 
Notwendigkeit, eine allgemeine Theorie der zufälligen Prozesse auszuarbeiten, 
d.h. eine Theorie, die Zufallsgrößen untersucht, die von sich stetig ändernden 
Parametern abhängen. 

Wir stellen nun eine Reihe von Aufgaben zusammen, welche die Notwendig- 
keit vor Augen führen, eine Theorie der zufälligen Prozesse zu entwickeln. 
Stellen wir uns vor, wir hätten uns zum Ziel gesetzt, die Bewegung irgend- 
eines Gas- oder Flüssigkeitsmoleküls zu verfolgen. Dieses Molekül stößt in zu- 
fälligen Augenblicken mit anderen Molekülen zusammen und ändert dabei 
seine Geschwindigkeit und seine Lage. Der Zustand des Moleküls ist also in 
jedem Zeitpunkt zufälligen Veränderungen unterworfen. Zur Untersuchung 
vieler physikalischer Erscheinungen muß man die Wahrscheinlichkeit dafür 
berechnen können, daß sich eine bestimmte Anzahl von Molekülen in dem 
einen oder anderen Zeitabschnitt um eine gewisse Strecke fortbewegt. Werden 
z.B. zwei Gase oder zwei Flüssigkeiten in Berührung gebracht, so werden 
gegenseitig die Moleküle der einen Flüssigkeit in die andere eindringen: Es 
findet eine Diffusion statt. Wie schnell und nach welchen Gesetzen geht der 
Diffusionsvorgang vor sich, wann stellt sich bei dieser Durchmischung prak- 
tisch Gleichgewicht ein? Auf alle diese und viele andere Fragen gibt die 
statistische Theorie der Diffusion, der die Theorie der zufälligen Prozesse, oder 
wie man gewöhnlich sagt, die Theorie der stochastischen Prozesse zu- 
grunde liegt, eine Antwort. Offensichtlich ergeben sich in der Chemie ähnliche 
Aufgaben, wenn man z.B. den Prozeß einer chemischen Reaktion untersucht. 
Welcher Teil der Moleküle ist schon in Reaktion getreten, wie ist der zeitliche 
Ablauf der Reaktion, wann ist die Reaktion praktisch schon beendet? 

Eine überaus wichtige Gruppe von Erscheinungen verläuft nach dem Prinzip 
des radioaktiven Zerfalls. Diese Erscheinung besteht darin, daß die Atome 
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einer radioaktiven Substanz zerfallen, indem sie sich in Atome eines anderen 
Elements verwandeln. Der Zerfall eines jeden Atoms geht wie eine Explosion 
momentan vor sich, wobei ein gewisses Energiequantum frei wird. Zahlreiche 
Beobachtungen zeigen, daß der Zerfall der verschiedenen Atome in Zeitpunkten 
erfolgt, die für den Beobachter ganz zufällig sind. Dabei ist die Lage dieser 
Zeitpunkte im Sinne der Wahrscheinlichkeitsrechnung voneinander unab- 
hängig. Bei der Untersuchung eines radioaktiven Zerfalls erhebt sich nun 
die folgende Frage: Wie groß ist die Wahrscheinlichkeit dafür, daß in einem 
bestimmten Zeitabschnitt eine gewisse Anzahl von Atomen zerfällt? Wenn 
man nur die mathematische Struktur des Prozesses betrachtet, sind viele 
andere Prozesse ganz gleich geartet: Die Anzahl der Anruie, die in einer Telefon- 
zentrale während eines bestimmten Zeitintervalls erfolgen (die Belastung der 
Telefonzentrale), das Reißen der Fäden an einer Spinnmaschine oder die 
Änderung der Anzahl der Teilchen, die sich bei einer Brownschen Bewe- 
gung zu irgendeinem Zeitpunkt in einem vorgegebenen Gebiet des Raumes 
befinden. Wir geben in diesem Kapitel eine einfache Lösung der mathe- 
matischen Aufgaben an, auf die man durch die erwähnten Erscheinungen 
geführt wird. 

Einige einfache angewandte Aufgaben, in denen konkrete zufällige Prozesse 
auftreten, haben wir schon früher studiert (s. Kap. I, $ 10, Beispiele 2, 3, 4 und 
Übungen 21, 22 zu Kap. I ferner $$ 15, 16 von Kap. II). 

Zu dem, was wir schon kennengelernt haben, fügen wir das folgende hinzu. 
In der Einleitung zu diesem Buch wurde darauf hingewiesen, daß die ersten 
Beispiele zufälliger Prozesse zu Beginn unseres Jahrhunderts von einer Reihe 
hervorragender Physiker studiert worden sind. Wir wollen hier kurz darlegen, 
wie von ihnen, ausgehend von der Betrachtung eines sehr schematischen Be- 
wegungsproblems die Differentialgleichung der Diffusion erhalten wurde. Das 
Schema der Überlegung ist das folgende: Das Teilchen möge zu den Zeitpunkten 
kr(k=1,2,3,...) unabhängige zufällige Stöße erleiden, die jedesmal eine 
Verschiebung des Teilchens um die Größe h nach rechts mit der Wahrschein- 
lichkeit p oder nach links mit der Wahrscheinlichkeit g=1—-p zur Folge 
haben. Wir bezeichnen mit f(x, £) die Wahrscheinlichkeit dafür, daß das Teil- 
chen nach n Stößen, ausgehend vom Punkt x = 0 zur Teit {= 0 im Punkt x 
auftritt (nach einer geraden Anzahl von Stößen kann x natürlich nur gleich 
einem geradzahligen Vielfachen von Ah, bei ungeradem n nur gleich einem un- 
geradzahligen Vielfachen von Ah sein). Wenn wir mit m die Anzahl der Schritte 
bezeichnen, die das Teilchen nach rechts unternimmt (entsprechend sei n —m 
die Zahl der Schritte, in denen das Teilchen nach links schreitet), so gilt nach 
der Formel von BERNOULLI 


fe.d=ap"f" (d-n). 
Natürlich sind die Größen m, n, x, r durch die Gleichung 


m—(n— m) = 
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miteinander verknüpft. Durch eine kurze Rechnung kann man sich leicht 
davon überzeugen, daß f(x, i) der Differenzengleichung 


et+d)=pf@—hN+g/a@+hh) () 
und den Anfangsbedingungen 


/0,)=1, f&,0)=0 für 20 
genügt. 

Wir betrachten das Verhalten dieser Differenzengleichung, wenn wir hund r 
gleichzeitig gegen 0 streben lassen. Die physikalische Natur der Aufgabe 
erfordert es, dem Verhalten von h und r gewisse Beschränkungen aufzuerlegen. 
Ebenso dürfen die Größen p und q nicht ganz beliebig gewählt werden. Sind die 
Bedingungen, von denen hier die Rede ist, nicht erfüllt, so gelangt das Teilchen 
in einem endlichen Zeitintervall mit der Wahrscheinlichkeit 1 ins Unendliche. 
Um diese Möglichkeit auszuschließen, stellen wir folgende Forderung auf: 
Bei n — 00 gelte 


ia. = h2 2—4 [6 
z=nh, i=nt, — —>2D, tn (2) 
wo c und D gewisse Konstante sind. Die Größe c heißt Strömungsgeschwindigkeit, 
während D Diffusionskoeffizient genannt wird. Ziehen wir von beiden Seiten 
der Gleichung (1) die Größe f(x, £) ab, so erhalten wir 


fat +9) — ad) = plfe —h, ) — fa, d] + de +, — Fa, d]- ©) 


Wir setzen voraus, daß f(x, f) einmal nach £ und zweimal nach x differenzierbar 
ist. Dann finden wir 


Kat +) — 1a, = TER 400), 


f@ — h,) — ia, d ME 1 Me y ua, 


nei. 


Ka+ ha = nd + Im EN 4 oc). 


Setzen wir dies in (3) ein, so erhalten wir 
2 92 
ie t) +0) = — pe ne [7] + zer & es t) + 0(h2) . 


Auf Grund Re Beziehungen (2) finden wir, - im Aal 
öflz, !) _ ze ) oz, t) 
öt u 02° 
gilt. Damit haben wir die Gleichung ei die in der Diffusionstheorie die 
ForRKEr-Prancksche Differentialgleichung genannt wird. 

Interessanterweise erhält man bei genügend künstlicher Aufgabenstellung 
ein physikalisch sinnvolles Resultat, das den Diffusionsvorgang recht gut 
widerspiegelt. Weiter unten werden wir allgemeine Gleichungen herleiten, 
denen die Verteilungen zufälliger Prozesse unter sehr allgemeinen Bedingungen 
über die Art ihres Ablaufes unterworfen sind. 
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Der Grundstein einer allgemeinen Theorie der stochastischen Prozesse wurde 
durch die fundamentalen Arbeiten von A. M. KoLmoGororr und A. J. CHs- 
TSCHIN zu Beginn der 30iger Jahre gelegt. In dem Artikel „Über die analytischen 
Methoden in der Wahrscheinlichkeitsrechnung‘‘ gab A. N. KoLMOGOROFF einen 
systematischen und strengen Aufbau der Grundlagen der Theorie der sto- 
chastischen Prozesse ohne Nachwirkung oder, wie man häufig sagt, der Prozesse 
vom Markowschen Typus. In einer Reihe von Arbeiten schuf CHinTscHin die 
Grundlage der Theorie der sogenannten slationären Prozesse. 


Wir bemerken, daß man vor einer mathematischen Behandlung irgendeiner 
Naturerscheinung oder gewisser technischer Prozesse diese schematisieren muß. 
Dies liegt daran, daß eine mathematische Behandlung eines Prozesses, bei 
dem man es mit Zustandsänderungen eines Systems zu tun hat, nur dann 
möglich ist, wenn vorausgesetzt wird, daß sich jeder mögliche Zustand dieses 
Systems eindeutig in mathematischer Form festlegen läßt, Es ist klar, daß 
ein solches mathematisch bestimmbares System nicht die Wirklichkeit selbst 
ist, sondern nur ein zu ihrer Beschreibung geeignetes Schema. So steht es 
z.B. in der Mechanik, wenn wir voraussetzen, daß die realen Bewegungen 
eines Systems materieller Punkte zu einem beliebigen Zeitpunkt durch Angabe 
dieses Zeitpunktes und des Zustandes des Systems zu einem beliebigen vorher- 
gehenden Zeitpunkt {, vollständig beschrieben werden können. Mit anderen 
Worten besteht das Schema, das man in der theoretischen Mechanik zur Be- 
schreibung der Bewegung benutzt, in folgendem: Man nimmt an, daß zu einem 
beliebigen Zeitpunkt ? der Zustand y des Systems vollständig durch den 
Zustand x zu einem beliebigen früheren Zeitpunkt i, bestimmt sei. Dabei 
versteht man in der Mechanik unter dem Zustand eines Systems die Lage der 
Punkte des materiellen Systems und ihrer Geschwindigkeiten. 


Außerhalb der klassischen Mechanik, eigentlich in der ganzen modernen 
Physik, sieht die Lage sehr viel komplizierter aus, wenn z.B. die Kenntnis 
des Zustandes eines Systems zu irgendeinem Zeitpunkt Z, nicht mehr den 
Zustand des Systems in den folgenden Zeitpunkten eindeutig bestimmt, sondern 
nur die Wahrscheinlichkeit dafür angibt, daß sich das System in einem Zustand 
einer gewissen Menge von möglichen Zuständen des Systems befinden wird. 
Bezeichnet x den Zustand des Systems im Augenblick t,, E eine Menge von 
möglichen Zuständen des Systems, so ist für die eben beschriebenen Prozesse 
die Wahrscheinlichkeit 


Pfi„z;t,E} 


dafür definiert, daß das System, das sich zur Zeit Z, im Zustand & befunden 
hat, im Augenblick ! in einen der Zustände der Menge E übergeht. 


Wenn sich diese Wahrscheinlichkeit nicht ändert, wenn man außerdem noch 
die Zustände des Systems in den Zeitpunkten £ < f, kennt, so nennt man einen 
solchen Prozeß einen Prozeß ohne Nachwirkung oder auf Grund seiner Analogie 
mit den Markowschen Ketten — einen Markowschen Prozeß. 
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Der allgemeine Begriff eines zufälligen Prozesses — aufgebaut auf der früher 
dargelegten Axiomatik — läßt sich folgendermaßen einführen. Es sei U die 
Menge der elementaren Ereignisse e und { ein stetiger Parameter. Ein zufälliger 
Prozeß ist dann eine Funktion zweier Argumente 

&(t) = le, I) (el). 

Für jeden Wert des Parameters ? ist die Funktion o(e, t) nur eine Funktion 
von e, ist also demnach eine Zufallsgröße. Für jeden festen Wert des Argumentse 
(d. h. für jedes elementare Ereignis) hängt @(e, f) nur von tab, ist also einfach 
eine Funktion eines reellen Arguments. Jede solche Funktion nennt man eine 
Realisierung des zufälligen Prozesses &(f). Ein zufälliger Prozeß läßt sich auf- 
fassen entweder als eine Gesamtheit von Zufallsgrößen £(?), die von einem Para- 
meter ! abhängen, oder als die Gesamtheit der Realisierung des Prozesses £{f). 
Natürlich muß zur Definition eines Prozesses notwendig im Funktionsraum 
seiner Realisierungen ein Wahrscheinlichkeitsmaß vorgegeben werden. 

Wir beschäftigen uns in diesem Kapitel nur mit der Untersuchung der Pro- 
zesse ohne Nachwirkung und der stationären Prozesse. 


$ 51. Der Poıssonsche Prozeß 


Wir beginnen mit der Darlegung einiger allgemeiner Resultate, die jetzt 
schon als klassisch gelten können und studieren ausführlich ein Beispiel für 
einen zufälligen Prozeß ohne Nachwirkung, der sowohl in der Theorie wie auch 
in den Anwendungen eine große Rolle spielt. 

In zufälligen Zeitpunkten möge ein gewisses Ereignis M eintreten. Uns 
interessiert die Anzahl des Eintretens von M im Zeitintervall (0, 2). Wir be- 
zeichnen diese Zahl mit &(f). Über den Prozeß des Auftretens von M setzen wir 
voraus, daß er 1. stationär, 2. ohne Nachwirkung und 3. ordinär sei. Diese 
Begriffe wollen wir sogleich erklären. 

Stotionarität bedeutet, daß die Wahrscheinlichkeit für das k-fache Auftreten 
(k=1,2,...) von M in irgendeiner Gruppe von endlichen sich nicht über- 
schneidenden Zeitintervallen nur von k und von der Länge dieser Zeitintervalle 
abhängt, sich aber bei einer Verschiebung aller dieser Intervalle um ein und 
dieselbe Größe nicht ändert. Insbesondere hängt die Wahrscheinlichkeit für 
das k-fache Auftreten von M im Intervall (7, T + £) nicht von T ab, sondern 
ist nur eine Funktion von k und £. 

Das Fehlen von Nachwirkung bedeutet, daß die Wahrscheinlichkeit für das 
k-fache Eintreten des Ereignisses M im Verlauf des Zeitintervalls (T, T +1) 
unabhängig davon ist, wie viele Male und wann M vorher eintrat. Mit anderen 
Worten soll die bedingte Wahrscheinlichkeit für das k-fache Auftreten von 
M im Intervall (T, 7 + £) unter beliebigen Voraussetzungen über das Eintreten 
von M vor dem Zeitpunkt T gleich der unbedingten Wahrscheinlichkeit sein. 
Insbesondere bedeutet das Fehlen von Nachwirkung die gegenseitige Unab- 
hängigkeit des k-fachen und /-fachen Auftretens von M in sich nicht über- 
schneidenden Zeitintervallen. 
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Die Ordinarität drückt aus, daß das zwei- oder mehrfache Auftreten von M 
in einem sehr kleinen Zeitintervall At praktisch nicht vorkommen kann. Wir 
bezeichnen mit P,,(Af) die Wahrscheinlichkeit für das mehr als einmalige 
Auftreten von M im Intervall At. Dann drückt sich die Bedingung der Ordi- 
narität in der Gleichung 


Pzı (At) = o(Af) 
aus. 


Unsere erste Aufgabe besteht darin, die Wahrscheinlichkeiten P,(f) dafür 
zu bestimmen, daß das Ereignis M k-mal in einem Intervall der Länge { ein- 
tritt. Wegen unserer Voraussetzungen hängen diese Wahrscheinlichkeiten 
nicht davon ab, wo sich dieses Zeitintervall befindet. Wir werden zunächst 
zeigen, daß bei kleinem At die Gleichung 


Pı(At) = At + 0(Al) 


gilt, wo A eine Konstante ist. Dazu betrachten wir ein Zeitintervall der Länge 1 
und bezeichnen mit p die Wahrscheinlichkeit dafür, daß das Ereignis M in 
diesem Intervall nicht auftritt. Wir unterteilen unser Zeitintervall in n sich 
nicht überschneidende gleiche Zeitintervalle. Wegen der Stationarität und 
dem Fehlen von Nachwirkung gilt die Gleichung 


[nl 


und daraus folgt 


k 
k — 
Po () = 
Die Nachwirkungsfreiheit führt uns jetzt bei beliebigem ganzzahligem k auf 
k 
k — 
Bl" 


Es sei { eine gewisse positive Zahl. Bei beliebigem n kann man ein solches k 
finden, daß 


u BL LR 
n n 
Da die Wahrscheinlichkeit P,(f) eine abnehmende Funktion der Zeit ist, folgt 


PC) > Pı >P,(,)- 


n 


Deshalb genügt P,(f) den Ungleichungen 
k—1 N 
p" ZP&$=Pp". 


Es mögen jetzt k und n derart gegen unendlich streben, daß 
k 
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Nach dem vorangehenden gilt natürlich 
Pd = pt. 
Da p als Wahrscheinlichkeit den Ungleichungen 
0<p<si 


genügt, können die folgenden drei Fälle auftreten: 1.p=0, 2.p=1, 
3.0<p<1. Die ersten beiden Fälle verdienen wenig Interesse. Im ersten 
gilt bei beliebigem £ die Gleichung P,(f) = 0, d. h. die Wahrscheinlichkeit dafür, 
daß das Ereignis M in einem Zeitintervall beliebiger Länge mindestens einmal 
auftritt, ist gleich 1. Dann ist aber auch die Wahrscheinlichkeit für das un- 
endlichfache Auftreten von M in einem Zeitintervall beliebiger Länge gleich 1. 
Im zweiten Fall ist P,(f) = 1, und folglich tritt M in einem Zeitintervall be- 
liebiger Länge nicht auf. Interesse verdient nur der dritte Fall, in der wir 
p = e”* setzen, wo A eine gewisse positive Zahl ist (A = — In p). 

Wir haben also aus den Voraussetzungen der Stationarität und dem Fehlen 
von Nachwirkung erschlossen, daß bei beliebigem f > 0 


Pd = et. () 
Die Voraussetzung der Ordinarität w..ue bisher noch nicht benutzt. 
Für kleine t folgt daraus 
PO =1—At+oll). 
Da für beliebige £ offensichtlich die Gleichung 
P&& + Pd + PO =1 

besteht, folgt für kleine ? 

Pd) =At + ol). () 


Jetzt können wir dazu übergehen, die Formel für die Wahrscheinlichkeit 
P,(Ö) für k > 1 herzuleiten. Zu diesem Zweck bestimmen wir die Wahrschein- 
lichkeit dafür, daß in der Zeit 2-+ At das Ereignis M genau k-mal eintritt. 
Dies ist auf k + 1 verschiedene Weisen möglich, nämlich: 1. Im Zeitintervall i 
tritt M k-mal auf und in der Zeit At ereignet sich nichts; 2. im Zeitintervall ? 
tritt M (k—1)-mal undin der Zeit At einmal auf;...;k + 1) im Zeitintervall ? 
ereignet sich nichts und in der Zeit At tritt das Ereignis M k-mal auf. 

Nach der Formel von der totalen Wahrscheinlichkeit gilt 


k 
Pı(t + At) = Z, P,_;(t) P;(4t) 


(hierbei werden die Voraussetzungen der Stationarität und der Nachwirkungs- 
freiheit benutzt). Wir setzen jetzt 


k 
P; ar -;() PA). 
Offensichtlich ist wegen der Ordinarität 


Pr <,E,Pi40) < & Pd = P-x(40) = od). 
=2 j=2 
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Daher ist 
Pt + At) = Pit) Po(At) + Pr— ıld) Pı(Al) + o(Ad). 
Wir haben aber früher bewiesen 
PA) =e tt! =1—RA + 0(dt). 
Weiter gilt nach (2) 
PA) =AAt + o(At), 
und so finden wir 
Pi + A) = (1 —AAt) PA) +AALP,_,(Al) + 0A). 
Hieraus ergibt sich 


Pitt + A)— Pit) _ 


At — AP) +A Pr) + ol). 


Bei AE—0 existiert der Limes der rechten Seite dieser Gleichung, und daher 
hat auch die linke Seite einen Limes. Wir erhalten daher die Gleichung 


EB — A Pd +4 Pr_) ö 


zur Bestimmung von P;(f). Offensichtlich führt die Voraussetzung der Ordi- 
narität und der von uns gefundene Ausdruck für P,(f) zu den Anfangsbedin- 


gungen 


P,(0)=1, P,(0) = 0 für k>1. (4) 
Die Lösung der Gleichung (3) wird sehr einfach, wenn wir setzen 
Pi) = er’ vu), 6) 


wo v;(f) eine neue unbekannte Funktion ist. Wegen (1) ist v,(t) = 1. Die Be- 
ziehung (4) führt uns auf die Anfangsbedingungen 


v,(0)=1 und 9(0)=0 für k>1. (6) 
Das Einsetzen von (5) in (3) liefert 
vd) = Av _ıd. (7) 
Insbesondere gilt 
iA. (7) 


Die schrittweise Lösung der Gleichungen (7°) und (7) führt uns unter Berück- 
sichtigung der Anfangsbedingungen auf die Gleichungen 


A E} 3 
„Oi, =, =, 


und allgemein 
(Ak . 


vlt) = r 


19* 


278 X. Die Theorie der stochastischen Prozesse 


Es gilt daher die Gleichung 


Br 
bei beliebigem k > 0. Damit ist unsere nass vollständig gelöst. 

Die Forderungen, denen der Prozeß des Auftretens von M unterworfen war, 
sind in guter Näherung bei einer großen Zahl von Naturvorgängen und tech- 
nischen Prozessen erfüllt. Zum Beispiel kann M der Zerfall eines Atoms eines 
radioaktiven Präparates oder das Auftreffen eines kosmischen Teilchens auf 
eine bestimmte Fläche bedeuten. Betrachten wir irgendein kompliziertes 
radiotechnisches System, das aus einer großen Anzahl von Elementen besteht, 
so gibt es für jedes dieser Elemente eine kleine Wahrscheinlichkeit dafür, daß 
es in der Zeiteinheit versagt, und diese Wahrscheinlichkeit ist unabhängig vom 
Zustand der anderen Elemente; in diesem Fall ist die Anzahl der Elemente, 
die im Zeitintervall (0, 2) versagen, ein zufälliger Prozeß, der in vielen Fällen 
gut durch den Poıssonschen Prozeß beschrieben werden kann. Die Anzahl 
solcher Beispiele kann man buchstäblich unbeschränkt vergrößern. 

Wir wollen hier noch bei zwei einfachen Eigenschaften des Poıssoxschen 
Prozesses verweilen. 

Das Zeitintervall, das von dem einen Auftreten des Ereignisses M an bis 
zum unmittelbar folgenden Auftreten vergeht, ist eine zufällige Größe, die wir 
mit r bezeichnen. Wir suchen die Wahrscheinlichkeitsverteilung von r. Offen- 
sichtlich ist das Ereignis 7 > f gleichbedeutend damit, daß im Zeitintervall 
kein Ereignis M auftritt, d.h. 

Pr>B=ct, 
Die gesuchte Verteilungsfunktion ist daher durch die Formel 


Pr <t=1—e* 
gegeben. 

Dieses Resultat können wir physikalisch in sehr verschiedener Weise deuten. 
Z.B. können wir diese Formel als die Verteilung der Laufzeit auf der freien 
Weglänge eines Moleküls oder als Verteilung der Zeit ansehen, die zwischen 
zweimaligem Versagen der Elemente eines komplizierten radiotechnischen 
Systems vergeht. 

Es sei bekannt, daß im Zeitintervall £ das Ereignis M unseres Prozesses 
n-mal (n> 0) aufgetreten ist. Wie sind unter dieser Voraussetzung diese 
Ereignisse M in dem Zeitintervall verteilt? Es wird sich zeigen, daß die be- 
dingte Verteilung der Zeitpunkte des Auftretens von M in diesem Zeitintervall 
eine gleichmäßige ist. Außerden sind die Zeitpunkte des Auftretens aller n 
Ereignisse M gegenseitig unabhängig. 

Wir bezeichnen mit B das Ereignis, das im n-maligen Auftreten von M im 
Zeitintervall (0, i) besteht. Wie aus obigem hervorgeht, ist die Wahrscheinlich- 
keit des Ereignisses B gleich 


Put) = er. 
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Da die n Ereignisse M im Intervall (0, f) bereits eingetreten sind, können wir 
sie individualisieren und unsere Aufmerksamkeit auf ein bestimmtes von ihnen 
lenken. Wir bezeichnen mit A das Ereignis, das darin besteht, daß im Zeit- 
intervall (a, 5) eingetreten ist, das im Intervall (0, f) liegt. Unsere Aufgabe 
besteht darin, die Wahrscheinlichkeit P(A/B) zu bestimmen. Nach dem 
Produktsatz ist 
P(A B) 

P(B) 
Wir müssen die Wahrscheinlichkeit für das gleichzeitige Auftreten der Ereig- 
nisse A und B bestimmen. Zu diesem Zweck betrachten wir das Ereignis C,,, 
das darin besteht, daß a) in (0, a) irgendwelche r Ereignisse M eintreten, jedoch 
nicht das uns interessierende, b) in (a, b) s Ereignisse M eintreten, unter denen 
sich das uns interessierende befindet, c) in (d, f) die übrigen n-r-s Ereignisse M 
eintreten. Für verschiedene Zahlenpaare (r, s) sind die Ereignisse C,, unver- 
einbar, und daher gilt 


P(A/B) = 


n—1 n—r 


AB=% 2 C.- 
0 3-1 
Die Wahrscheinlichkeit, im Intervall (0, a) r Ereignisse M, in (a, b) s Ereignisse 
M und in (b, f) n-r-s Ereignisse M zu erhalten, ist wegen der Nachwirkungs- 
freiheit gegeben durch 
Gar „1. Ab a)" „na AU —bP=tTe ac—n, (10) 
r! s! (n —r —s)! 
Dieser Ausdruck ist jedoch nicht die Wahrscheinlichkeit des Ereignisses C,,, 
denn in ihm ist noch nicht die Bedingung berücksichtigt, daß das uns interes- 
sierende Ereignis im Intervall (a, b) liegt. Um diesen Umstand zu berücksich- 
tigen, müssen wir (10) noch mit der Wahrscheinlichkeit dafür multiplizieren, 
daß unter den im Intervall (a, b) eingetretenen Ereignissen M das uns interessie- 
rende ist. Diese Wahrscheinlichkeit ist gleich dem Quotienten der Anzahlen 
von Möglichkeiten, in denen man s— 1 Elemente aus n — 1, beziehungsweise 
s Elemente aus n herausgreifen kann, d.h. gleich 


Daher gilt 


n—1 n—r 
P(A B) =e-*tjn 2 2 & a Ir 
Einfache algebraische Tee führen uns auf die Gleichung 
P(AB)= Ze em. 
Nach dem obigen gilt daher 


P(A|B) = = 8, (1) 
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Diese Gleichung beweist das behauptete Resultat. 

Die hier entwickelte Theorie kann übrigens auch in den Fällen angewendet 
werden, in denen der Parameter ? nicht die Rolle der Zeit spielt. Wir geben 
dafür folgendes Beispiel. 


Beispiel. Im Raum seien Punkte unter Berücksichtigung der folgenden 
Forderungen verstreut: 


1. Die Wahrscheinlichkeit, daß sich k Punkte in einem Gebiet G befinden, 
hängt nur von dem Volumen v dieses Gebietes, aber weder von seiner Form 
noch von seiner Lage im Raum ab. Wir beziehen diese Wahrscheinlichkeit 
mit Pr®)- 

2. Die Anzahl der Punkte, die in disjunkte Gebiete fallen, sind unabhängige 
Zufallsgrößen. 


E Pıldo) = (dv). 
k=2 


Diese Bedingungen drücken nichts anderes aus als Stationarität, Fehlen von 
Nachwirkung und Ordinarität. Daher gilt 
Go en, 


Pn(®) = ET € 


Bringt man in irgendeine Flüssigkeit kleine Teilchen irgendeines Stoffes, so 
befinden sich diese Teilchen unter dem Einfluß der Stöße der umgebenden 
Moleküle in ständiger ungeordneter Bewegung (BRowssche Bewegung). Daher 
erhalten wir in jedem Zeitpunkt eine zufällige Verteilung der Teilchen im Raum, 
von der wir eben sprachen. Nach der Theorie müssen wir annehmen, daß in 
unserem Beispiel die Anzahl der Teilchen, die in irgendein bestimmtes Gebiet 
fallen, dem Porssonschen Gesetz unterworfen ist. 

In Tabelle 12 werden die Versuchsergebnisse mit Goldteilchen in Wasser 
mit den Rechenergebnissen nach dem Poıssoxschen Gesetz verglichen. Die 
Zahlen stammen aus einem Artikel von SMOLUCHOWSKI. 


Tabelle 12 


relative 
kai Zahl der Häufigkeit in g—A Zahl der 
Teilchen beobachteten m : berechneten 
Fälle —- mi Fälle 
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Die Konstante A = av, durch die das Poıssonsche Gesetz bestimmt wird, 
ist gleich dem arithmetischen Mittel aus den beobachteten Teilchenzahlen 
gewählt, d.h. 


en Dar 1 ee a in re Or Br ste ht os 1,54. 
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Für das Folgende müssen wir den im ersten Kapitel eingeführten Begriff der 
bedingten Wahrscheinlichkeit auf den Fall einer unendlichen Menge möglicher 
Bedingungen verallgemeinern. Insbesondere müssen wir den Begriff der be- 
dingten Verteilungsfunktion bezüglich einer Zufallsgröße einführen. 

Wir betrachten ein Ereignis B und eine Zufallsgröße £ mit der Verteilungs- 
funktion F(x). Wir bezeichnen mit A,, das Ereignis 

— a <se<re+tß. 
Nach den Definitionen des ersten Kapitels ist 
P{BA,s} = P{A.,} * P[Bl/A,} = [Fe +) — Fe —a)] P{BJA,,} , 
woraus man 
P{BAys} 
B a nt Fer > m 
PEBIA = GH —He—a) 
erhält. Der Grenzwert 
z P{B Aug} 
HU, I ee 9 _ 
„a0 F@ + A Fle—6) 


heißt, falls er existiert!), die bedingte Wahrscheinlichkeit des Ereignisses B 
unter der Bedingung € = x und wird mit dem Symbol P{B/x} bezeichnet. Offen- 
bar ist P{B/x} bei festem x eine endlich-additive Funktion des Ereignisses B, 
die auf einem gewissen Ereignisfeld definiert ist. 

Unter gewissen Bedingungen, die praktisch immer erfüllt sind, besitzt P{ B/x} 
alle Eigenschaften einer gewöhnlichen Wahrscheinlichkeit, die den Axiomen 
1—3, $8, genügt. 

Ist 7 eine Zufallsgröße und bezeichnet B das Ereignis n < y, so heißt die 
Funktion ®(y/x) = Pfn < y/x} — die, wie man leicht sieht, eine Verteilungs- 
funktion ist —, die bedingte Verteilungsfunktion der Größe n unter der Bedingung 
€&=r. Ist F(e, y) die Verteilungsfunktion der Zufallsgrößen &£ und n, so ist 
offensichtlich 

_ı Fae+By)— Fle—a,y) 
en nen)‘ 


wenn dieser Grenzwert existiert. 


!) Dieser Grenzwert existiert für fast alle Werte x im Sinne des durch die Funktion 
F(x) bestimmten Maßes. 
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Wenn die Funktion P{B/x} bezügl. F(r) integrierbar ist, so gilt die Formel 
der totalen Wahrscheinlichkeit 


P{B} = f P{Bix} dF(a). 


Zum Beweis dieser Formel zerlegen wir das Variationsintervall der Größe & 
durch die Punkte  (=0, +1,+2,...) in Intervall , <E<x;,,. Wir 


bezeichnen mit A, das Ereignis 2, <£<zx;,, . Nach dem erweiterten Addi- 
tionsaxiom erhalten wir 


P{B}= 2 P{BA)= Z PIBIA) IF.) —F@)l. 


Nun teilen wir die Intervalle (x; x;,ı) in immer kleinere ein, so daß die maxi- 
male Länge der so gewonnenen Intervalle gegen Null strebt. Nach der Definition 
der bedingten Wahrscheinlichkeit und des StreLtses-Integrals erhalten wir 
hieraus 

P{B} = [ P{Bjx} dF(x).. 
Insbesondere ist ' 


®y) = Pin <y} = f Plyla) dF(e) . (1) 
Wenn die Wahrscheinlichkeitsdichte der Größe » existiert, so ist 
Yy) = S plyle) dF@), 16%) 


wobei o(y/x) die bedingte Verteilungsdichle der Größe 7 ist. 


Beispiel. Als Beispiel für die Anwendung der Formel (1) betrachten wir 
die folgende Aufgabe aus der Ballistik. Bei einem Schuß auf irgendein Ziel 
können Fehler von zweierlei Art auftreten: 


1. in der Bestimmung der Lage des Ziels, 


2. Schießfehler, die aus einer großen Anzahl verschiedener Ursachen ent- 
stehen können (einer Schwankung in der Größe der Geschoßladung, einer 
Ungenauigkeit in der Form des Geschosses, in einem Zielfehler, unwesentlichen 
Schwankungen der atmosphärischen Bedingungen usw.). 

Fehler der zweiten Art bezeichnet man als technische Streuung. Es werden 
n unabhängige Schüsse bei einer bestimmten Lage des Ziels abgegeben. Man soll 
die Wahrscheinlichkeit dafür bestimmen, daß wenigstens einer von ihnen ins 
Ziel trifft. 

Der Einfachheit halber beschränken wir uns auf die Betrachtung eines 
eindimensionalen Zieles der Länge 2a. Das Geschoß sehen wir als einen Punkt 
an. Wir bezeichnen mit f(x) die Wahrscheinlichkeitsdichte der Lage des Ziels 
und mit 9,(x) die Wahrscheinlichkeitsdichte für die Treffpunkte des i-ten 
Geschosses. 

Wenn der Mittelpunkt des Ziels sich im Punkt z befindet, so ist die Wahr- 
scheinlichkeit, ins Ziel zu treffen, beim i-ten Schuß gleich der Wahrscheinlich- 


$52. Bedingte Verteilungsfunktionen und die Bayzssche Formel 283 


keit, in das Intervall (2 — a, z + a) zu treffen, d. h. gleich!) 
z+a 
S gie) de. 
z—ıa 


Die bedingte Wahrscheinlichkeit eines Fehlschusses beim i-ten Schuß unter 
der Bedingung, daß sich der Mittelpunkt des Zieles im Punkt z befindet, ist 
gleich 


z+o 
1— S pda) de. 


Die bedingte Wahrscheinlichkeit, daß alle n Schüsse (unter derselben Be- 
dingung) nur Fehlschüsse sind, ist gleich 
n z+& 
ri (1 — f aa) de). 
i=1 2—& 
Hieraus schließen wir, daß die Wahrscheinlichkeit, wenigstens einen Treffer 


zu erzielen, unter der Bedingung, daß sich der Mittelpunkt des Zieles im Punkt z 
befindet, gleich 


n z+a 
2 a (1— f Pie) de) 
i=1 z—& 
ist. 
Die unbedingte Wahrscheinlichkeit wenigstens eines Treffers ist also (nach 
Formel (1)) gleich 


>= Soh-äh-ponde 


Wenn sich die Schießbedingungen von Schuß zu Schuß nicht ändern, so ist 
px) = pla)(i=1,2,...,n) und somit 


Pe | f@) f = (1 -f ol) de) \de 


Wie früher bezeichne A; das Ereignis , << x;,,. Nach dem klassischen 
Satz von Bayss ist 
PIAIB = WO 
{A/B} P{B} 


Wenn F(x) = Pf£ < x} und Pf£ < x/B)} stetige Ableitungen nach x besitzen, 
so erhalten wir unter Benutzung des Mittelwertsatzes die Formel 


F'(&£) P{B/JA 
P{A,/B} = pP, @&/B) (441 — 2%) = N a — 2) 


1) Wir setzen hierbei voraus, daß die Bestimmung der Lage des Zieles und die technische 
Streuung voneinander unabhängig sind. 
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mit <<, K<%<%;,. In der Grenze erhalten wir für 4 —z, 
%y4ı ?T 
_ Pe) PiB/e} 
Ps(&/B) = 77 
oder 
xılB) = _ Die) PiBiz} R 2 
Diese Gleichung nennt man die Bayzssche Formel. 

Das Ereignis B bestehe nun darin, daß eine Zufallsgröße 7 einen Wert zwi- 
schen y— a und y + ß annimmt, und die bedingte Verteilungsfunktion ®(y/x) 
der Größe n besitze bei jedem x eine stetige Verteilungsdichte p,(y/x). Strebt 

z = — P{Bjx} für a > 0 und 8 — 0 gleichmäßig bezüglich x gegen p,(yla), 
so gilt, wie aus der Formel (2) folgt, die Gleichung 

Pe) nu 
S Pntylz) pie) de 


Diese Formel werden wir im folgenden Kapitel] viel benutzen. 


dann 


Pxzly) = 
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Wir kommen nun zur Untersuchung der zufälligen Prozesse ohne Nachwir- 
kung, beschränken uns aber nur auf die einfachsten Probleme. Insbesondere 
werden wir voraussetzen, daß die Menge der möglichen Zustände eines Systems 
die Menge der reellen Zahlen ist. Ein zufälliger Prozeß ist also für uns eine 
Gesamtheit von Zufallsgrößen (2), die von einem reellen Parameter ? abhängen. 
Den Parameter ! nennen wir die Zeit und sprechen vom Zustand des Systems im 
einen oder anderen Zeitpunkt. 

Eine vollständige wahrscheinlichkeitstheoretische Charakterisierung eines Pro- 
zesses ohne Nachwirkung erhalten wir durch Angabe einer Funktion F{f, x; r, y), 
welche die Wahrscheinlichkeit dafür anzeigt, daß im Zeitpunkt r die Zufallsgröße 
&(r) einen Wert kleiner als y annimmt, wenn bekannt ist, daß im Zeitpunkt 
tt < r) die Gleichung &(f) = x bestand. Die zusätzliche Kenntnis der Zustände 
des Systems in früheren Zeitpunkten als ? hat im Falle der Prozesse ohne 
Nachwirkung auf die Funktion (f, x; r, y) keinen Einfluß. 

Wir geben nun einige Bedingungen an, denen die Funktion F(t,x;r, y) 
genügen muß. 

Zunächst müssen für sie, wie für jede Verteilungsfunktion, bei beliebigen x, ? 
und 7, y die Gleichungen 

lim Fl, 2;ry)=0, lim Fi, 2;7,y)=1 


y>—o. yj+to 


erfüllt sein.?) 


ı) Wir bemerken, daß der Parameter t (die Zeit) gewöhnlich auf einer Halbgeraden 
(6 > t,) vorgegeben wird. 
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Zweitens muß die Funktion F(f, x; r, y) bezüglich des Arguments y linksseitig 
stetig sein. 

Wir setzen jetzt voraus, daß die Funktion F(f, x; r, y) in £, 7 und in x stetig ist. 

Wir betrachten die Zeitpunkte f,s,r(!<s<r). Zur Zeit { möge sich das 
System im Zustand & befinden. Dann geht es mit der Wahrscheinlichkeit 
d,F(t, x; s, z) im Augenblick s in einen der Zustände aus dem Intervall (z, z + dz) 
über. Da es ferner aus einem Zustand z, in dem es sich zur Zeit s befindet, mit 
der Wahrscheinlichkeit F(s, z; 7, y) im Zeitpunkt r in einen Zustand kleiner als 
y übergeht, finden wir nach der Formel (1) des vorigen Paragraphen 

Ft, 2; 7, y) = [ F(s, 2; t, y) d,F(t, 2; s, 2). 

Diese Gleichung nennt man die verallgemeinerte MArkowsche Gleichung, da 
sie eine Übertragung der Gleichung (1), $ 18, aus der Theorie der Markowschen 
Ketten auf die Theorie der zufälligen Prozesse darstellt und in dieser Theorie 
eine ebenso große Rolle spielt, wie die erwähnte Identität in der Theorie der 
Markowschen Ketten. 

Die Wahrscheinlichkeit Ft, x; r, y) ist bis jetzt nur für 7 > t definiert. Wir 
vervollständigen diese Definition, indem wir 
0 füt y<e, 


lim Fit, x; 7, y) = m 2;T,y) = E@,y) = i ie 


r>t-+0 [207 
setzen. 
Wenn die Dichte 


ieh = 
Mand- Fit, x;t, y) 
existiert, so gelten für sie folgende evidente Gleichungen: 


fie x;1T,2)dz = Flt,2;r,yY), 
= Sites; 9)Jdk=1. 


In diesem Fall muß die verallgemeinerte Markowsche Gleichung folgender- 
maßen geschrieben werden: 


Kerle zu Wir; de. 
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Wir nennen einen zufälligen Prozeß £(f) stetig, wenn &(f) in kleinen Zeitab- 
schnitten nur mit einer kleinen Wahrscheinlichkeit einen merklichen Zuwachs 
erhält. Wir fordern hier von einem Prozeß £(f) die starke Stetigkeit: Für jede 
Konstante 6 (ö > 0) gilt die Beziehung 


img | Wrt— A269) =0. a) 


Unsere nächste Aufgabe besteht in der Ableitung von Differentialgleichungen, 
denen unter gewissen Bedingungen die Funktion Ft, x;r,y) genügt, die den 
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stetigen zufälligen Prozeß ohne Nachwirkung festlegt. Diese Gleichungen 
wurden zuerst von A.N. KoLMOGOROFF streng bewiesen (obwohl die zweite von 


ihnen bis dahin bereitsin den Arbeiten der Physiker aufgetreten war), und heißen 
die KorLmocororfschen Gleichungen. 
Wir setzen voraus, daß 


1. die partiellen Ableitungen 


örlt,x;r, y) RR &Flt,x;rT,Y) 
öx 0x? 
existieren und bei beliebigen Werten t, x und 7 > { stetig sind; 
2. für jedes ö > 0 die Grenzwerte 


a | W-94F@—A,2;t,y)=ala) @) 
3di>0 we 
und 
1 2 . u 
Jim zu | . Ki — 2)? d,Ft — At, 251,4) = bit, 2) () 


existieren!) und diese Konvergenz bezüglich x gleichmäßig ist. 

Die linken Seiten der Gleichung (2) und (3) hängen von ö ab. Diese Ab- 
hängigkeit ist jedoch auf Grund der Definition der Stetigkeit eines Prozesses, 
(d.h. nach (1)) nur scheinbar. 


Die erste KoLmogororrsche Gleichung. Wenn die eben formulierten 
Bedingungen 1. und 2. erfüllt sind, so genügt die Funktion F(t, x; r, y) der Glei- 
chung 

erlt,z;r,y) _ Orlt, x; T, y) bii,x) RFli,x;rT,y) 4 
_— =: h) og ( 


1) A.N. KoLmoGoRoFrF bewies die Existenz der Grenzwerte aft, x) und b(f, x) unter der 
Voraussetzung, daß bei vorgegebenen x und s die Determinante 


2 Hs, ®, Y) u Hs, 2,8, y") 
2 
3 fs, 2,0’, y’) 2 Hs 2, 1", y") 


für beliebige ?', t'', y', y'’ nicht identisch verschwindet. Wenn man wörtlich die Überlegun- 
gen von A. N. KoLmoGoroFF wiederholt, kann man folgendes beweisen: Aus (1) und der 
Voraussetzung, daß bei vorgegebenen x und s die Determinante 


2 F(s,z,t',y\), n F(s, x, 1”, y”) 


02 ’ 04 0° „ ar 
Zur %,U,%), ray: »Y ) 
für beliebige t’, t"’, y’, y'’ nicht identisch verschwindet, folgt die Existenz der Grenzwerte 
alt, x) und bit, x). 


Die anschauliche Bedeutung der Funktionen « und 5 erklären wir am Ende des Para- 
graphen. 
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Beweis. Nach der verallgemeinerten Markowschen Gleichung ist 
F(t— 4t,2; 1, y) = f Fit, z; t, y) d,F(t — At, x; 1,2). 
Außerdem ist auf Grund der Eigenschaften einer Verteilungsfunktion 
Fit, x; , y) = [ Fit, x; t, y) d,F(t — At, x; 1,2). 


Aus diesen Gleichungen schließen wir auf die Beziehung 
Fit — At, x; r,y) — Fit, x;r, y) 
At 


= 4 ji [Ft, z; T, y) — Fit, x; t, y)] d,F(t — At, x; t, z). 
Nach der Taytozschen Formel gilt unter unseren Voraussetzungen die Gleichung 
Ft, 2;1, y) = Fl, 2;7,y) + @— 2) en 


m x;T,Yy) 


+32) +0(@— 2). 


Die folgenden analytischen Umformungen erfordern keine weiteren Erklärungen: 
Fit — At,x;r,y) — Flt,x;7T,y) 


At 
-—ı [F(t, z; 7, y) — F(l, 2; t, y)] d, FE — At, 2; 1, 2) 
le—al25 
+, j [FG 2;7, ) — F@&z, 2y)] d,Fl — At,x; 1,2) 
a —z|>5 
-— | IFbau)—F6 27, W]dFd— Al z;t,2) 
22128 
un T, y) gr j (z — x) d,F(t — At, x; t, z) 
le —z|<ö 
44er N Ten + ol ]ARL- 4262. 0 


a —21<ö 
Wir gehen nun zur Grenze At—0 über. Der erste Summand der rechten 
Seite besitzt nach (1) = Grenzwert 0. Der zweite Summand ist nach (2) in der 
Fee gleich at, — . Schließlich kann sich der dritte Summand von 
F 
z bi, &%) — 7,5, ur um einen Summanden unterscheiden, der für ö — 0 gegen Null 


eh Da aber die linke Seite der letzten Gleichung von ö nicht abhängt, und 
die eben angeführten Grenzwerte von ö nicht abhängen, so existiert der Limes 
der rechten Seite und ist gleich 


Bu 2% Wı 


alt, x) 


1 aFlt,x;r,Y) 
+7 bit, x) in 
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Hieraus schließen wir auf die Existenz des Grenzwertes 
R Fit — Ai, x;7,y) — Pit, 2;t, y) erlt,z;T,yY) 
lim —_ 25 000 257002 0 2257, 
40 Ai ö 


Die Gleichung (5) führt uns auf die Gleichung (4). 
Wenn man die Existenz der Verteilungsdichte 


2; 7, y) = a Fit, 2; 7, 3) 


voraussetzt, so zeigt eine einfache Differentiation von (4), daß die Dichte 
ft,x;ry) der Gleichung 


öflt, 2; Y) di alt, x) a T,y) RL bit, x) ft, = T, y) =0 (4) 
+3 0x° 
genügt. 

Wir kommen nun zur Ableitung der zweiten KoLmoGororrschen Gleichung. 
Dabei streben wir nicht die allgemeinste Formulierung an, sondern machen einige 
Annahmen, die mit dem Wesen der Sache an sich nichts zu tun haben. Neben 
den bereits gemachten Voraussetzungen legen wir der Funktion Ft, 2; r, y) 
noch folgende Beschränkungen auf: 


3. Es existiere die Verteilungsdichte 
R _alz;uy),. 
est, yJ)=- u’ 

4. es mögen die stetigen Ableitungen 


er, Id lazeyl, le MEET HN] 


existieren. 
Die zweite KorLmocororrsche Gleichung?). Wenn die Bedingungen 


(1) bis (4) erfüllt sind, so genügt für einen stetigen zufälligen Prozeß ohne Nach- 
wirkung die Dichte ap z;r,y) der Gleichung 

öflt, 2; 7, 

een _ 2 [ae y) Man] + 4 er]. ©) 


Beweis. Es seien a und b (a<< b) irgendwelche Zahlen und A(y) eine nicht 
negative stetige Funktion, die stetige Ableitungen bis zur zweiten Ordnung ein- 
schließlich besitzt. Außerdem fordern wir, daß 


R(y) =0 für y<a und y>b 


ist. Aus der Bedingung der Stetigkeit der Funktion R(y) und ihrer Ableitungen 
schließen wir, daß 


R(a) = R(b) = R’(a) = R’(b) = R”(a) = R’(b) = 0 m 


1) Die zweite KoLmocororrsche Gleichung wurde schon früher von den Physikern FOkKER 
und PLANcK im Zusammenhang mit der Entwicklung der Diffusionstheorie aufgestellt. 
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ist. Wir gehen aus von den Gleichungen 
b ; M b 
aflt,x;T,Yy) _ı 4 
[FE Roa-7 | Kt, ©; €, y) Ry) dy 
a 
lim [{&s + I Mon) R(y) dy. 
40 Ar 


Nach der verallgemeinerten Markowschen Gleichung gilt 


it x2;T+ Ar, y) = Si T,T, z) I, zTcH+ Ar, y) dz, 
und daher 


b 
afli,x;r, y) 
[Erw ay 


= - im 4| j | j&, 257,2) Kr, 2; + Ar, y) R(y) dz dy 

— [it 2; 5,9) RQ) au] 
= lim | | 1& 235,9 Ku 257 + Ar, u) R@) dyde 

— [it 2;, 9) R@) dy] 
= im [Mr W)| | He u; = + 47,2) Re)de—RQ)] ay. 


4dr—0 Ar 


Die ausgeführten Umformungen sind evident: Das erste Mal vertauschten wir 
die Reihenfolge der Integrationen, beim zweiten Mal änderten wir die Bezeich- 
nungen der Integrationsveränderlichen (y in z und zin y). 

Nach der Tayrorschen Formel ist 


RG) = R) + @— 3) RQ) + @— Y R’) + o[@—y2]. 
Wegen der Beschränktheit der Funktion R(z) und wegen der Bedingung (1) gilt 
S[ fu y;r + Ar, z) R(e) de = 0(Ar) 
v—2128 


und 
S Io; T+ Au D)d=1+olAr). 
Iv—2l<ö 


Daher erhalten wir 


S I&, y;7+ Ar, 2) Re) d— R(y) = Eu ER 2-9 Kay; + Au,z).az 


+7 RS fe — 3) +0 ((@— Y)] fr, y;T + Ar, z)dz + 0(Ar). 
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Es ist also 


öflt, x; T, y) 
[29 zwar 


ee; | IK 237, y) WR / B —y) fr, y;t + Arz,)dz 


+3 RW) | le +0@— We ur + An dde+ an) dy. 


v—z| <ö 


Wir gehen nun zur Grenze Ar —0 über. Auf Grund der Voraussetzungen über 
die gleichmäßige Konvergenz gegen die Grenzwerte in (2) und (3) schließen wir, 
daß sich die letzte Gleichung in der Form 


b 


je WETN Rg)dy= | ft, 2; 7, y) [at WR) + Ib, »R’Q) dy 


Schreiben läßt. 
Da R’(y) = R’(y) = 0 füry <aundy > bist, so erhalten wir 


b b 
[FE rw a = [16.2379 [at m RW) + ze) R’W| dv. ® 


Durch partielle Integration und unter Benutzung der Gleichungen (7) finden wir 


b b 
| f@, 2;, y) az, y) R'y) dy = — | RG) 2. late, ) I, 23%, Way, 


b b 
v & 
[1a 25,0 60 r@ay= [RW re db 27, D1ay. 
a a 
Nach Einsetzen der gewonnenen Ausdrücke in (8) erhalten wir 


[ar oft, ©; 5 u) R(y) dy 


- f I 3, latı, 9) Mu 25% 9] +2 2m [Kr I 2; vo)]] RW) au. 


Diese Gleichung läßt sich offenbar folgendermaßen schreiben 


b 
[ [here PS 4 [atz, y) X, 2; %, y)] 


dw 0. © 
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Da die Funktion R(y) beliebig ist, so folgt aus der letzten Identität die Glei- 
chung (6). Angenommen, dies wäre nicht so, dann existierte ein Quadrupel von 
Zahlen (f, x, r, y), für das der in (9) in geschweiften Klammern stehende Aus- 
druck von Null verschieden ist. Unter unseren Voraussetzungen stellt dieser 
Ausdruck eine stetige Funktion dar; folglich ließe sich ein Intervalla <y<ß 
finden, in dem sich sein Vorzeichen nicht ändert. Ista <oundb > ß, so setzen 
wir Ry)=0für y<a und y>Pß und Ry)>0Ofür a<y<Pß. Bei einer 
solchen Wahl von R(y) müßte das auf der linken Seite der Gleichung (9) ste- 
hende Integral von Null verschieden sein. Wir kämen so zu einem Widerspruch. 
Folglich ist unsere Annahme falsch, und aus (9) folgt (6). 

Das Hauptproblem besteht natürlich nicht darin nachzuweisen, daß eine 
vorgegebene Funktion f(f, 2; 7, y) den KorLmogororrschen Gleichungen genügt, 
sondern darin, eine unbekannte Funktion f(f,x;r, y) auf Grund dieser Glei- 
chungen zu bestimmen, wobei die Koeffizienten a(t, x) und b(f, x) als bekannt 
vorausgesetzt werden. Außerdem sucht man dabei nicht irgendeine Lösung 
der KorLmocororrschen Gleichungen, sondern nur die, die den folgenden For- 
derungen genügen: 

1./&,2;, )>0 fürall 4,7, Y, 


2. [It,2s;u, )dy=1 


und für beliebiges 6 > 0 (10) 
3. im S Mau, yJ)dy=0. 
7—t y— 225 


Wir halten uns nicht dabei auf, dieBedingungen zu untersuchen, die man den 
Funktionen a(f, x) und b(f, x) auferlegen muß, damit eine Lösung der KoLmo- 
«ororrschen Gleichungen existiert, die den aufgestellten Forderungen genügt 
und überdies eindeutig ist. 

Wir verschärfen etwas die Stetigkeitsforderung, um die physikalische Bedeu- 
tung der Koeffizienten a(f, x) und 5(f, x) zu erläutern. An Stelle von (1) wollen 
wir voraussetzen, daß bei beliebigem ö > 0 die Beziehung 

lim 1 f (y— 2) d,FÜ— Ar, z;t,y) = 0 (v) 
40 At 
v—xl>ö 
besteht. Man sieht leicht ein, daß aus (1”) die Formel (1) folgt. Die Forderun- 
gen (2) und (3) lassen sich nun in der Form 


lim 1 | y— 2) d,Flt — At, 2; 1, y) = alt, x) (x) 
4: 0 4t 
und 
im 3 | (y— 2)? d,Ft— At, x; 1, y) = bit, 2) (69) 
4dt—0 di 
schreiben. 


Die übrigen Forderungen sowie die Schlußfolgerungen ändern sich nicht, 
wenn man (1) durch (1’) ersetzt hat. Da 


[W— 2) d,Fd— 4t,2;1,y) = MI&) — Ed — Ad] 


20  Gnedenko 
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die mathematische Erwartung der Änderung von {£(f) in der Zeit At ist und 
SW — 2° d,Ft — At, x;t,y)= ME) — &(dt— AY]® 

die mathematische Erwartung des Quadrats der Änderung von &(f) und somit 
proportional der kinetischen Energie ist (unter der Voraussetzung, daß £&(f) die 
Koordinate eines sich auf Grund von zufälligen Einwirkungen bewegenden 
Punktes ist), so ergibt sich aus (2’) und (3’), daß a(f, x) die mittlere Geschwindig- 
keit von &(f) und b(f, x) proportional der mittleren kinetischen Energie des von 
uns untersuchten Systems ist. 

Wir schließen diesen Paragraphen ab mit der Betrachtung eines Spezialfalles 
der- KoLmocororrschen Gleichungen, in dem die Funktion /(l, x;r, y) von f,r 
und y—z, nicht aber von x und y selbst abhängt. Physikalisch bedeutet dies, 
daß der Prozeß im Raum homogen verläuft: Die Wahrscheinlichkeit, daß ein 
Zuwachs A = y—-x erfolgt, hängt nicht davon ab, in welcher Lage x sich das 
System im Zeitpunkt i befindet. Offenbar hängen in diesem Fall die Funktionen 
a(t,x) und b(t,x) nicht von x ab, sondern sind nur Funktionen des einzigen - 
Arguments E: 

at) =aft,x), bil)=bit,a). 


Die KorLmocororrschen Gleichungen schreiben sich in diesem Falle folgender- 
maßen: 


= — a) 028, 

(11) 
 JREBERF S.. PRIRR &f 
> nur LuUrr 


Wir betrachten zunächst den Spezialfall, daß a(i) = 0 und b(f) = 1 ist. Die 
Gleichungen (11) gehen dann in die Wärmeleitungsgleichung 


41 
a 2 
und in die dazu konjugierte (12) 
En BL. 
a 2 Mm 


über. 

Aus der allgemeinen Theorie der Wärmeleitungsgleichung weiß man, daß die 
einzige Lösung dieser Gleichungen, die den Bedingungen (10) genügt, durch die 
Funktion 


_Ww-:) 


1 e 2 (r—1) 


Y2r(e—1i) 


gegeben ist. Durch die Variablensubstitution 


IC; T,T, y) = 


[4 T 
"=1—fad)d, yY=y—f[al)d, 


@ 


= fie) dz, ’= [oe dz 
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gehen die Gleichungen (11) in die Gleichungen (12) über. Dies ermöglicht es, 
die gesuchte Lösung der Gleichungen (11) in der Form 


_W-2—4) 


1 
e 20° 


oy2n 


fd,x2;r,y) = 


zu schreiben, wobei 


T 


A=[a)dk, ®= fie) dz 
t t 
gesetzt ist. 
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In der modernen Naturwissenschaft spielen die Prozesse eine große Rolle, 
bei denen die Änderungen eines Systems nicht stetig, sondern sprunghaft 
vor sich gehen. Beispiele dieser Art von Aufgaben sind in dem einleitenden 
Paragraphen dieses Kapitels angeführt. 

Wir nennen einen zufälligen Prozeß £&(!) rein unstetig, wenn die Größe &(f) 
im Verlaufe eines beliebigen Zeitintervalls (£, {+ At) mit der Wahrscheinlich- 
keit 1 — plt,x) At + o(At) ungeändert und gleich x bleibt und nur mit der 
Wahrscheinlichkeit p(f, x) At + o(At) eine Änderung erfahren kann (wir nehmen 
dabei an, daß die"Wahrscheinlichkeit mehr als einer Änderung von £{f) im Zeit- 
intervall At gleich o(At) ist). Da wir uns auf die Betrachtung von Prozessen 
ohne Nachwirkung beschränken, hängt natürlich die Verteilungsfunktion der 
weiteren nach einem Sprung erfolgenden Änderungen von £(f) nicht mehr davon 
ab, welchen Wert £(!) in den Augenblicken vor dem Sprung besaß. 

Wir bezeichnen mit P(t,x,y) die bedingte Verteilungsfunktion von £(f) 
unter der Bedingung, daß im Zeitpunkt ?{ ein Sprung vorlag, und daß bis un- 
mittelbar vor dem Sprung £(£) gleich x (d. h. &(t — 0) = x) war. 

Die Verteilungsfunktion F(f,x;r, y) läßt sich leicht durch die Funktionen 
p(t, x) und Pt, x, y), nämlich in der Form 
Fit, 2; 7, y) = [1 — pdi, 2) (r—1)] E(&, y) + (T—1) pt, x) Plt, x, y) +0(r—1) (1) 
ausdrücken. 

Im Sinne der Definition der Funktionen p(i, x) und P(t, x, y) sind diese nicht 
negativ, und Pt, y, x) genügt als Verteilungsfunktion den Gleichungen 

Pl,a, —&)=0, Pl, +o)=1. 


Außerdem setzen wir voraus, daß p(f, x) beschränkt ist und daß die Funk- 
tionen pff, x) und P(t, x, y) bezüglich { und x stetig sind (es genügt vorauszu- 
setzen, daß sie bezüglich x BoREL-meßbar sind). 


In bezug auf die Funktion F(f, x;r,y) machen wir keine weiteren Voraus- 
setzungen, sichern nur ihre Definition im Punkt?! =r: 
Ofüry<e, 
1füry>r. 

Eine der Aufgaben dieses Paragraphen ist der Beweis des folgenden Satzes. 
20* 


>t+0 


lim Ft, x; 7, y) = lim Ft, 2;t,y) = E(«, y) = | 
t-T—0 
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Satz. Die Verteilungsfunktion F(l,x;r,y) eines rein unstetigen Prozesses 
ohne Nachwirkungen genügt den beiden folgenden Integrodifferentialgleichungen: 


rauen — plt, 2) [F, u )— j Flt,2; 7,3) d,Plt, 2, 2], (2) 


u! RER | pl, 2) d,Fl, x; 7, y) + j plz, 2) Pit, 2, y) d,F(, 237,2). 8) 


Die Gleichung (2) fand A. N. KoLmoGororr im Jahre 1931; unter unseren 
Voraussetzungen wurden beide Gleichungen (2) und (3) von W. FELLER im 
Jahre 1937 aufgestellt. Wir wollen daher die Gleichungen (2) und (3) die 
KOLMOGOROFF-FELLERBSchen Gleichungen nennen. 

Beweis. Auf Grund der verallgemeinerten Markowschen Gleichung ist 

Fl, 2;r,y) = f Ft + At, z;, y) d,F(t, 2; + At, 2). 
Setzen wir hier den Wert von F(f,2;1+ At,z) nach der Formel (1) ein, so | 
finden wir die Gleichung | 
Fit, 2; 7, y) = f Ft + At, z;r, y) d,[1 — pt, x) A(D) + o(At)] Ex, z) 
+ [Fit + At, z;r, y) d,[p(t, x) At + o(Al)] Plt, x, 2). 


S[ Fit + At, z;7,y) dE(e, 2) = F(t + At,2;r,y) 


Da 


ist, erhalten wir 
Fit, x;t, y) = [1 — pf&, x) At] FE + At,x; 7, y) 
+ At plt, x) [ F(t + At, z; r, y) d,P(t, x, z) + o(Af). 
Hieraus gewinnen wir die Beziehung 
Pi + At,x; an Zt z;T, y) = pl, a) F(t + At, x; 7, y) 
— pft, x) f F(t + At, z; 7, y) d,P(t, x, z) + o(1). 


Der Grenzübergang führt uns auf die Gleichung (2). 

Mit Hilfe der Markowschen Gleichung und der Gleichung (1) sowie mit Hilfe 
der Definition der Funktion E(x, z) kann man die folgende Kette von Gleichun- 
gen aufschreiben: 


Fit, x2;7 + Ar, y) = [ Fu 2; + Ar, y) d,F(t, 2; r, 2) 
= f {fl — p(z, z) Ar] E(z, y) + Ar plz, 2) P(t, z, y) + o(Ar)} d,Flt, 2; 7, 2) 
— [ ar, 2;1,2)— Ar [ pt. 2) d,Fit, x; 7, 2) 
Es "+ At ple, 2) Pfr, 2, y) d,F(, 2; 7,2) + o(Ar). 


Auf dem üblichen Wege folgt hieraus die Existenz der Ableitung = sowie die 
Gleichung (3). 
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Wir lösen nun noch eine für die Anwendungen wichtige Aufgabe: Mit welcher 
Wahrscheinlichkeit kann ein System im Verlauf des Zeitintervalls von £ bis 
(7 >) seinen Zustand n-mal (n = 0, 1,2,...) ändern? 

Wir bezeichnen mit p,„(£, x, r) die Wahrscheinlichkeit dafür, daß, ausgehend 
von einem Zustand x im Zeitpunkt i, das System bis zum Zeitpunkt r n-mal 
seinen Zustand ändert. Wir beginnen die Lösung der Aufgabe mit dem Fall 
n=0. 

Zu diesem Zweck stellen wir die folgende Gleichung auf: 


Polt, 2, 7) = pol, , Cr + Ar) + Pol, ) 1 — pol, er + Al. 


Sie besagt, daß es auf die beiden folgenden, miteinander unvereinbaren Arten 
vorkommen kann, daß sich der Zustand des Systems im Zeitintervall (£, 7) 
nicht ändert: 

1. Das System ändert seinen Zustand in einem größeren Zeitintervall 
(,T + Ar) nicht. 

2. Das System ändert seinen Zustand bis zum Zeitpunkt 7 nicht, jedoch 
ändert sich sein Zustand im Zeitintervall (r,r + Ar). 

Da nach Definition des rein unstetigen Prozesses 


BP, T+ Ad) = 1— pls x) Ar + 0o(Ar) 


ist, so läßt sich die Gleichung (4) auch noch anders schreiben: 


EL Eu Et LE NE DE TE 
PR ü : ö ‚ Epo(t, x, 7) 
Lassen wir hier Ar —0 gehen, so finden wir, daß die Ableitung —-—— 
5.4» ötT 
existiert und daß 
RN = — pult, 2, 7) plt, 2) 
ist. Wenn wir diese Gleichung integrieren, so finden wir 
—f: rlu,z)du 

Pob,x,T)= Ce! 

Wegen 
Po, T)=1 
istC=1lund 
—r vAu,z)du 
Pol, 1) =e h (5) 


Wenn wir py(t, x, r) sowie die oben definierte Funktion P(t, x, y) kennen, so 
können wir — wie wir jetzt sehen werden — jede beliebige Wahrscheinlichkeit 
Pr(t, x, r) berechnen. Eine n-malige Änderung des Zustandes tritt folgender- 
maßen ein: 


1. Bis zum Zeitpunkt s (te <s<r) ändert das System seinen Zustand nicht 
(die Wahrscheinlichkeit dieses Ereignisses ist gleich p,(t, 2, s)), 
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2.im Intervall (s, s + As) ändert das Systeın seinen Zustand (die Wahrschein- 
lichkeit dafür ist gleich p, (, 2,5 + As) =p(s,2) As + 0(4s), 


3. die Wahrscheinlichkeit dafür, daß der neue Zustand des Systems zwischen 
y und y-+ Ay liegt, ist gleich P(s,x,y + Ay) — P(s, x, y) = 4, P(s, 2, y), 
4. schließlich ändert das System in der Zeit (s + 4s, r) seinen Zustand (n — 1)- 
mal; die Wahrscheinlichkeit dieses Ereignisses ist gleich p„_1(s -+ 4s, y, r). 
Die Wahrscheinlichkeit dafür, daß alle vier aufgezählten Ereignisse eintreten, 
ist auf Grund des Multiplikationssatzes gleich 
Polt, 2, s) [p(s, ©) + o(1)] As A,P(s,%, y) pn + As, y, 7). 


Da s und y beliebig sein können E <s<rund — © <y< oo), so ist nach 
der Formel der totalen Wahrscheinlichkeit 


Pılt, 2, 7) = SS Pot, x, s) P($, 2) Pn—ı(5; Y, 7) d,P(s, x, y) ds 


= [ Pelb.2, 5) P6, 2) J Pa—ı@& 4, 7) d,P@, 2, y) ds. (6) 
Hieraus ergibt sich insbesondere 
Pill, 2, 7) = f Pol, 2, 5) P(S, X) F Po(; 9, 7) d,P(s, 2, y) ds. (7) 


Das Verfahren zur Bestimmung von p,(}, &, ?) ist nun klar: Nach der Formel (5) 
finden wir py(f, x, r), nach der Formel (7) berechnen wir p,(4, x, ) und dann 
nacheinander pz(f, X, T), Pal, &, r) und schließlich p,(t, &, 7). 


Beispieli. Die uns interessierende Größe £(f) sei die Anzahl der Zustands- 
änderungen in der Zeit von 0 bis r. Unter der Voraussetzung p(f, x) = a mit 
einer Konstanten a > 0 bestimme man p,(b 2, ?). 

Mögliche Zustände des Systems sind in unserem Fall alle nicht negativen 
ganzen Zahlen (e=0,1,2,...) und nur diese.) Da bei jeder Zustands- 
änderung die Größe &£(l) um genau Eins wächst, so ist 


pre 9 für y<ce+i, 
GEN- fry>z+i. 


Nach Formel (5) haben wir 


Pot, 2, 7) = eme—P; 
nach (7) ist 


pl, x, Tr) = f Poll, &, 5) PCs, 2) Pos, x + 1, T) ds 
i 
= afe-e—a eedad—a (t Bu ) PT 
i 


1) Man sieht leicht ein, daß dieses Beispiel und der Inhalt von $51 nur ihrer Formulie- 
rung nach verschieden sind. 
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Nach (6) bekommen wir 


Ps(t, &, 7) = Pot, %, S) PS, 2) pı x + 1,7) ds 


Di [a (—1)] (r—1) 
ua: Yen De 


Wir setzen nun voraus, es sei 


Pn—ı(, 2, 7) = . E = 7 ET, 


Nach Formel (6) ergibt sich dann die a 
Pill, a, 2) = j Poll, 2, 5) 6,2) n_&,c + 1,Dds 


ala ng BER un 
a R—D! u le Tue 


Damit ist bewiesen, daß bei beliebigem ganzen n > 0 


—1t 
Pr(k, %, zT) er eat —i) 
ist. Die Lösung unserer Aufgabe ist also das Poıssonsche Gesetz. Insbesondere 


ist 


0,0, = er, 
Man überlegt leicht, daß die Funktion 
0 für ysez, 
Fit, 2; 7, y) = B3 ar M ae) für y>r 
n<y—z 


eine Lösung der Integrodifferentialgleichungen (2) und (3) ist. 


Beispiel2. Im Zeitpunkt t = 0 seien N radioaktive Atome vorhanden. Die 
Wahrscheinlichkeit des Zerfalls eines Atoms im Zeitintervall (d, £ + At) ist gleich 
aN(t) dt + o(At), wobei a > 0 eine Konstante ist. N(f) bezeichnet die Anzahl 
der Atome, die bis zum Zeitpunkt ! noch nicht zerfallen sind. Man bestimme die 
Wahrscheinlichkeit dafür, daß in der Zeit von fbis r n Atome zerfallen.!) 

Hier liegt ein typischer rein unstetiger zufälliger Prozeß vor. Die Größe n 
kann natürlich nur die Werte 0, 1,2,...,_N(f) annehmen. 

Nach der Bedingung der Aufgabe ist 


0 für <0Ounde>N, 
P&,2) = (N P 
(N—x) für O<rsN 


1) Wir setzen dabei voraus, daß die Zerfallprodukte eines Atoms selbst nicht mehr zer- 
fallen und in jedem Falle nicht auf die noch nicht zerfallenen Atome einwirken. 
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und 
0 für y<ae+l, 
Pl.2.0) =|, für y>z+1. 


Wir bestimmen zunächst die Wahrscheinlichkeit dafür, daß in der Zeit von O 
bis z n Atome zerfallen. Nach der Formel (5) ist 


— 70,0 
Po, 0,1) =e ° =e-aNt, 


Ebenso erhält man 
Poll, k, r) — ere(N—kh) (—l) 


Ferner ist nach Formel (7) 
% 
Pı(0, 0, 7) ei Po(0, 0, s) p(s, 0) Ppo(s, 1, r) ds 
= ferettaNe-a-n (r—) ds 
ö 
=NeNt faet9 dg=Ne-Nrfe— 1]. (8) 
ö 


Nach Formel (6) findet man leicht nacheinander p;(0, 0, r), pz(0, Or) usw. 
Der Leser möge beweisen: 


Pz(0, 0,7) = Che rferr— 1p. (9) 
Offenbar gilt fürO <n <N —k die Gleichung 
Palt, kr) = ge AN E09 — IP. (9) 


Wir können nun zur Bestimmung der uns interessierenden Wahrscheinlich- 
keit übergehen, die wir mit p,(f, r) bezeichnen wollen. Nach der Formel der 
totalen Wahrscheinlichkeit finden wir unter Benutzung von (9) und (9) die 
Beziehung 


Non 
Pı(t, 7) =2 Px(0, 0, 1) pu(t, k, 7) 


Non 
= [4 eeNt [e*: BEN 1]* CH euN—k) (F—1) u) er 1]r 
=0 


N— 
— g-aNt [e «9 2 1]* 2 & DM er k(e—) [e*: En 1]# t 
k=0 


Da 


und 
N—n 


EZ [et (e — yE=[1 + er — ern 
0 
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ist, so ist schließlich 
Al) = lee Per Hier. 
Man prüft leicht nach, daß die Funktion 
N) für y<e, 
Ft, 2; 7, y) = Pakt z,7) für ysN—ı, 
1 für y>oN—ı 
eine Lösung der Integrodifferentialgleichungen (2) und (3) ist. 
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Wir betrachten nun eine wichtige Klasse von zufälligen Prozessen, deren 
vollständige Charakterisierung mit Hilfe von charakteristischen Funktionen 
erfolgen wird. » 

Unter einem homogenen zufälligen Prozeß mit unabhängigen Zuwachs versteht 
man die Gesamtheit aller von einem reellen Parameter f abhängenden Zufalls- 
größen £(f), die den beiden folgenden Bedingungen genügen: 


1. Die Verteilungsfunktion der Größe &(f + 1,) — &(t,) hängt nicht von !, ab 
(Homogenität des Prozesses in der Zeit); 


2. für eine beliebige endliche Anzahl sich nicht überlappender Intervalle 
(a, b) des Parameters t sind die Differenzen &(b) — &(a) voneinander unabhängig 
(Unabhängigkeit des Zuwachses). 

Unter den homogenen zufälligen Prozessen mit unabhängigem Zuwachs hat 
man mit besonderer Sorgfalt den Prozeß der Brownschen Bewegung studiert, 
der später auch die Bezeichnung WıEnzxscher Prozeß erhielt. Für Prozesse 
dieser Art macht man außer den beiden angeführten noch die folgenden Voraus- 
setzungen: 


3. Die Größe &(f) — &(s) ist normal verteilt. 
4. MI&C) — So] = 0, DIE) — &)] = lt —5|, 


wo o eine Konstante ist. Wir haben oben schon einen homogenen Prozeß mit 
unabhängigem Zuwachs betrachtet, nämlich den Poıssosschen Prozeß. 

Bevor wir konkrete Resultate ableiten, betrachten wir einige Beispiele. In 
diesen Beispielen können die Bedingungen, von denen wir eben sprachen, als 
Arbeitshypothese angenommen werden. Natürlich läßt sich ihre Zulässigkeit 
nur durch die Übereinstimmung der Resultate mit der Erfahrung rechtfertigen. 


Beispieli. Diffusion der Gase. Wir betrachten irgendein Gasmolekül, 
das sich unter den anderen Molekülen desselben Gases bei konstanter Tempe- 
tur und konstanter Dichte bewegt. Wir führen im Raum kartesische Koordi- 
naten ein und verfolgen, wie sich im Laufe der Zeit eine der Koordinaten, sagen 
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wir die x-Koordinate, des herausgegriffenen Moleküls ändert. Infolge der zu- 
fälligen Zusammenstöße des gegebenen Moleküls mit anderen Molekülen ändert 
sich diese Koordinate mit der Zeit, indem sie jeweils einen zufälligen Zuwachs 
erhält. 

Die Forderung der Konstanz der äußeren Bedingungen, unter denen sich das 
Gas befindet, bedeutet offensichtlich die Homogenität des untersuchten Pro- 
zesses in der Zeit. Im Hinblick auf die große Zahl der sich bewegenden Mole- 
küle und der schwachen Abhängigkeit ihrer Bewegungen ist der Prozeß ein 
Prozeß mit unabhängigem Zuwachs. 


Beispiel 2. Die Geschwindigkeiten der Moleküle. Wir betrachten 
wieder ein beliebiges Gasmolekül, das sich in einem mit Molekülen ein und des- 
selben Gases konstanter Dichte und konstanter Temperatur angefüllten Volu- 
men bewegt. Wir beziehen den ganzen Raum wieder auf kartesische Koordi- 
natenachsen und verfolgen, wie sich die Geschwindigkeitskomponente in bezug 
auf eine der Koordinatenachsen mit der Zeit ändert. In seiner Bewegung ist das 
Molekül zufälligen Zusammenstößen mit anderen Molekülen ausgesetzt. Infolge 
dieser Stöße erhält die Geschwindigkeitskomponente jeweils einen zufälligen 
Zuwachs. Es liegt wieder ein homogener zufälliger Prozeß mit unabhängigem 
Zuwachs vor. 


Beispiel3. Radioaktiver Zerfall. Bekanntlich besteht die Radioaktivi- 
tät eines Elements darin, daß sich seine Atome in Atome eines anderen Elements 
verwandeln, wobei große Energien frei werden. Beobachtungen an verhältnis- 
mäßig großen Mengen eines radioaktiven Elements zeigen, daß der Zerfall der 
verschiedenen Atome unabhängig voneinander vor sich geht, so daß die Anzahlen 
der zerfallenen Atome in sich nicht überdeckenden Zeitintervallen voneinander 
unabhängig sind. Außerdem hängen die Wahrscheinlichkeiten dafür, daß inner- 
halb eines Zeitintervalls von bestimmter Länge eine gewisse Anzahl von Atomen 
zerfällt, nur von der Länge dieses Intervalls und praktisch nicht davon ab, wo 
es zeitlich liegt. In Wirklichkeit nimmt natürlich die Radioaktivität eines 
Elements in dem Maße allmählich ab, wie sich die Masse des Elements vermin- 
dert. In verhältnismäßig kleinen Zeitintervallen (und für nicht zu große Mengen 
des Elements) ist jedoch diese Änderung so unbedeutend, daß man sie völlig 
vernachlässigen kann. 

Man kann leicht eine große Anzahl weiterer Beispiele anführen, in denen die 
uns interessierende Naturerscheinung oder der betreffende technische Prozeß 
als ein homogener zufälliger Prozeß mit unabhängigem Zuwachs angesehen 
werden kann. Wir weisen ergänzend noch auf einige solcher Beispiele hin: die 
kosmische Strahlung (die Anzahl der kosmischen Teilchen, die in einem be- 
stimmten Zeitintervall auf ein bestimmtes Flächenstück niederfallen), das 
Reißen des Fadens an einer Spinnmaschine, die Belastung eines Telefonisten 
(die Anzahl der Anrufe während eines bestimmten Zeitintervalls). 

Wir gehen nun dazu über, die charakteristische Eigenschaft der homogenen 
zufälligen Prozesse mit unabhängigem Zuwachs aufzufinden. 
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Die Verteilungsfunktion des Zuwachses der Größe &(f) im Zeitintervall r 
bezeichnen wir mit F(z, r). Sind dann die Zeitintervalle 7, und 7, disjunkt, so ist 


Fa +%)=/[F@—y; u) d,F@%). 69) 
Ist /(z, r) die charakteristische Funktion, d.h., ist 
fa) = Se" dF@; 7), 


so schreibt sich die Gleichung (1) mit Hilfe der charakteristischen Funktionen 
in der folgenden Form: 


zu +) =faı) far). ) 


Sind allgemein 7,, 7, ..... , 7, disjunkte Zeitintervalle, so ist 
n n 
Is: 2 o)=1 fer). 
k=1 k=1 


n 
Ist insbesondere, =,='"=zund Y 7% =[1t,soist 
k=1 


fe.) =\r2:4)). 


Die Verteilungsfunktion eines beliebigen homogenen zufälligen Prozesses mit 
unabhängigen Zuwachs ist unbeschränkt teilbar. 

Man muß bemerken, daß man zur Betrachtung der unbeschränkt teilbaren 
Verteilungsgesetze in der Wahrscheinlichkeitsrechnung gerade durch die Unter- 
suchung der homogenen Prozesse mit unabhängigem Zuwachs kam. Wir sahen, 
daß die Theorie der unbeschränkt teilbaren Verteilungsgesetze auf die Entwick- 
lung der klassischen Probleme der Wahrscheinlichkeitsrechnung hinsichtlich 
der Summierung von Zufallsgrößen einen entscheidenden Einfluß nahm. Wäh- 
rend früher — worauf wir bereits hingewiesen haben — das Interesse der For- 
scher auf die Bestimmung der allgemeinsten Bedingungen konzentriert war, 
unter denen das Gesetz der großen Zahlen gilt und die normierten Summen 
gegen das Normalgesetz konvergieren, ergaben sich, nachdem A. N. KoLmo- 
GOROFF die Klasse der Gesetze vollständig charakterisiert hatte, welche die homo- 
genen zufälligen Prozesse ohne Nachwirkung beherrschen, die allgemeineren 
Aufgaben, die wir im vorigen Kapitel betrachtet haben. Es zeigte sich dabei, 
daß die Verteilungsgesetze, die sich bei der Summation von Zufallsgrößen als 
asymptotische Gesetze ergaben, in der Theorie der zufälligen Prozesse die Rolle 
exakter Lösungen entsprechender Funktionalgleichungen spielen. Darüber 
hinaus gestattet dieser neue Gesichtspunkt die Gründe aufzudecken, weshalb 
in der klassischen Wahrscheinlichkeitsrechnung nur zwei Grenzverteilungslunk- 
tionen — das Normalgesetz und das Poıssonsche Gesetz — betrachtet wurden. 

Da für homogene Prozesse mit unabhängigem Zuwachs bei beliebigem r > 0 


f@, 7) = If, DI’ 
ist, sind sie durch Vorgabe der charakteristischen Funktionen der Größe 
&(1) — &£(0) vollständig bestimmt. In $45 sahen wir, daß für unbeschränkt 


302 X. Die Theorie der stochastischen Prozesse 
teilbare Gesetze mit endlicher Dispersion 
. . . 1 
log fz,1)=iyz + ft{e*—1—izu}dG(u) (2) 


ist, wobei y eine reelle Konstante und G(u) eine nicht fallende Funktion mit 
beschränkter Variation ist. Wir beschränken uns auf die Betrachtung dieses 
Spezialfalls homogener Prozesse. 

Wir führen in der Formel (2) folgende Bezeichnung ein: 


u 
Mu) = j 46) für u<o, 


NW) = — [d60) für u>0, 


®=6(+9) 60-0); 
(2) geht dann über in 


o 


2 


lg (a, 1)=iyz— ——- + ers _1—izu) dM() 


8 


+ [fe —1-izu} dN(u). 2) 
0 


Wir wollen nun die wahrscheinlichkeitstheoretische Bedeutung der Funk- 
tionen M(u) und N(u) erklären. 
In $ 45 führten wir bei der Ableitung der Formel für die kanonische Darstel- 
lung der unbeschränkt teilbaren Gesetze die Funktion 
u 
G,(u)=n f x? dd,() 
— co 


ein. Wir setzen nun 
“ 
M,(u) = | 46) = n Bu) für u<o 
und = 


N,„(u) = -[ 7 dG,(a) =—n[1—G,(w] für u>0. 


Da für n — ooin allen Stetigkeitsstellen der Funktion G(u) 
G„(u) > G(u) 


gilt, schließen wir nach dem zweiten HeLLyschen Satz, daß in den Stetig- 
keitsstellen der Funktion M(u) 


M,„(u) = n ©,(u) > M(u) 
gilt. 
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Vom Standpunkt der zufälligen Prozesse ist ®,(x) (x < 0) die Wahrschein- 

k k+l 
lichkeit dafür, daß die Größe £(r) im Variationsintervall (r R = des Para- 
meters 7 einen negativen Zuwachs erhält, der dem Betrage nach größer als x 
ist. M,„(x) ist also die über alle k von O0 bis n — 1 erstreckte Summe der Wahr- 


k i 
scheinlichkeiten dafür, daß die Größe &(f) im Variationsintervall u u) des 


Parameters 7 einen negativen Zuwachs durch einen Sprung erhält, der dem 
Betrage nach größer als x ist. Da M(u) und N(u) für n — oodie entsprechenden 
Grenzfunktionen der Funktionen M,„(u) und N,„(u) sind, so erhielten sie die 
Bezeichnung Sprungfunktionen. 

Ist (für u < 0) M(u) = 0 und (für u > 0) N(W= 0, d.h. wenn die Sprung- 
funktionen fehlen, so ersieht man aus der Formel (2°), daß in diesem Fall der 
stochastische Prozeß durch das Normalgesetz beherrscht wird. Wir sehen, 
daß ein durch das Normalgesetz beherrschter zufälliger Prozeß im Sinne der 
Wahrscheinlichkeitsrechnung ein stetiger Prozeß ist. Wir beweisen nun eine 
noch schärfere Behauptung. 


Satz. Ein homogener zufälliger Prozeß mil unabhängigem Zuwachs und 
einer endlichen Dispersion!) wird dann und nur dann durch das Normalgesetz?) 
beherrscht, wenn bei beliebigem e>0 die ang rei dafür, daß der 


—I(k=1,2,...,n 
-)( ) 


absolute Betrag des Zuwachses von &@) im Intervall De 
die Größe e übertrifft, zusammen mit I „gegen Null sirebt. " 


Beweis. Wir sahen eben, daß ein homogener zufälliger Prozeß mit unab- 
hängigem Zuwachs dann und nur dann durch das Normalgesetz geregelt wird, 
wenn für 2>0 

M—)=Na)= 0 (3) 
ist. Wegen 


M(u) = Bis nn und N(u) = ‚um a Nele 


ist die Bedingung (3) mit der folgenden gleichwertig: 
Im y=lor 1 d,))=0. (4) 


n— 00 


Wir bezeichnen den Zuwachs von £(r) im Intervall Fe, .) mit &,,; dann ist 
Pak = D,— x) + 1— D,(z + 0) =P K&nzl > x} . 


!) Dieser Satz ist auch ohne die Voraussetzung einer endlichen Dispersion richtig. 

2) Insbesondere auch durch das Normalgesetz mit der Dispersion 0, d.h. ein Gesetz 
der Form F(x) = 0fürz <a, Fix) =1lfürxz> a. 

®) Die durch das Normalgesetz regulierten Prozesse und nur diese sind also im Sinne 
der Wahrscheinlichkeitsrechnung „gleichmäßig stetig“. 
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Offenbar sind die Beziehungen (4) mit der folgenden Äquivalent: 


N 
lim 2 Prrm0. 
n>ook=1 
Aus den Ungleichungen 


n Le —EPuk 
1—- 2 Pu sUl—p)setl <I 
k=n k=1 
ersehen wir, daß die Beziehungen (4) mit der Behauptung 


n 
im ZA —p)=1 
n> 0 k=1 
äquivalent ist; diese besagt, daß die Wahrscheinlichkeit der Ungleichungen 
[En] <x für alle kl <k<n) für n— oo gegen Eins strebt. Anders aus- 
gedrückt, wir haben bewiesen, daß die Beziehungen (3) dann und nur dann 
gelten, wenn für n — 00 


P{ max |&.]>e}—0, 
d 1<ksn 
q.e.d. 


$ 57. Der Begriff des stationären zufälligen Prozesses. Der Satz von ÜHINTScHIN 
über die Korrelationsfunktion 


Die Prozesse vom Markowschen Typus oder, anders ausgedrückt, die Pro- 
zesse ohne Nachwirkung, die wir in den letzten Paragraphen untersuchten, 
werden bei weitem nicht allen Anforderungen der Naturwissenschaft an die 
Wahrscheinlichkeitsrechnung gerecht. In vielen Fällen haben die früheren 
Zustände eines Systems einen sehr starken Einfluß auf die Wahrscheinlich- 
keiten seiner zukünftigen Zustände, und man kann diese Einwirkung der 
Vergangenheit bei approximativer Behandlung der Fragen nicht vernach- 
lässigen. Prinzipiell kann man sich in einer solchen Lage helfen, indem man 
den Begriff des Zustandes eines Systems durch Einführung neuer Parameter 
abändert. Wenn wir z.B. die Lageänderung eines Teilchens bei Diffusions- 
erscheinungen oder bei der Brownschen Bewegung als einen Prozeß ohne 
Nachwirkung betrachten, so bedeutet dies, daß wir die Trägheit des Teilchens 
nicht berücksichtigen, die selbstverständlich in diesen Erscheinungen eine 
wesentliche Rolle spielt. Indem man die Geschwindigkeitskomponenten des 
Teilchens neben seinen Lagekoordinaten in den Begriff des Zustandes mit 
hineinnahm, konnte man in diesem Falle die Situation meistern. Es gibt 
jedoch Fälle, in denen ein solcher Kunstgriff bei der Lösung der gestellten 
Aufgaben keinerlei Erleichterungen bietet. In erster Linie muß man hier 
auf die statistische Mechanik hinweisen, in der die Angabe, daß ein Punkt 
in dem einen oder anderen Bereich des Phasenraumes liegt, nur ein Wahr- 
scheinlichkeitsurteil über seinen zukünftigen Zustand zuläßt. Dabei ändert 
die Kenntnis der früheren Lage des Punktes wesentlich unser Urteil bezüglich 


$ 57. Der Begriff des stationären zufälligen Prozesses 305 


seines zukünftigen Verhaltens. In diesem Zusammenhang sonderte A. J. 
CHINTScHIN eine wichtige Klasse von zufälligen Prozessen mit Nachwirkung, 
die sog. siationären Prozesse, aus, die sich bezüglich der Zeit homogen 
verhalten. 

Ein stochastischer Prozeß &(f) heißt stationär, wenn die Wahrscheinlichkeits- 
verteilungen der beiden endlichen Gruppen von Veränderlichen &(t), &(2), - - - » 
&(,) und &(t, + u), &(la + u),...,&(, + u) identisch sind, also nicht von u ab- 
hängen. Die Zahlen n und u sowie die Zeitpunkte L,1,,...,t, sollen dabei 
ganz beliebig gewählt sein. Führt man die Bezeichnung 


Flag 222, Uns bar dap a 5 En) = PLE) < u Ele) < ip. El) < m} M) 


ein, so gilt nach der eben angegebenen Definition bei beliebigen u und n die 
Gleichung 


Fanta tn...,+W)=Fl,ry:.-.itela...,4). (1) 


Die Verteilungsfunktionen F(x,, 2... ns ty da» - - ‚ &,) eines jeden zufälligen 
Prozesses müssen offenbar den beiden folgenden Bedingungen genügen: 


1. Der Symmetriebedingung: Bei einer beliebigen Permutation i,iy,...,! 
der Zahlen 1,2,...,n gilt die Gleichung 


Fa Be ei ea 


2. der Verträglichkeilsbedingung: Ist m<n, so gilt bei beliebigen t„.1, 
LARER TER 
Fo tete) 
= Fl las) (2) 


In den letzten Jahren wurde die Theorie der stationären Prozesse in be- 
deutendem Maße in Physik und Technik angewandt. Auf stationäre Prozesse 
führt z. B. die Untersuchung einer Reihe akustischer Erscheinungen, darunter 
die in der Radiotechnik auftretenden zufälligen Geräusche, ferner die Auf- 
findung verborgener Periodizitäten, die den Astronomen, den Geophysikern 
und den Meteorologen interessieren. 

Häufig kann man in einem technologischen Prozeß leicht Erscheinungen 
feststellen, die nach dem Schema der stationären Prozesse verlaufen. Als 
Beispiel betrachten wir den Prozeß des Spinnens. Sehr ungleichmäßige Eigen- 
schaften des zu verspinnenden Materials, (z.B. die Länge der Fasern, ihre 
Festigkeit, die Größe ihres Querschnitts usw.), Schwankungen in der Ge- 
schwindigkeit und in der Gleichmäßigkeit des Transports des Produktes an 
den Maschinen zu verschiedenen Etappen des Spinnprozesses und verschiedene 
andere Ursachen führen dazu, daß sich die Eigenschaften des Fadens ständig 
ändern. Dabei zeigt es sich, daß die Kenntnis der einen oder anderen Eigen- 
schaft des Fadens in irgendeinem Teil der Docke uns noch keine Kenntnis 
seiner Eigenschaften in irgendeinem anderen Teil vermittelt. Da man jedoch 
den Spinnprozeß als eingelaufen ansehen kann, bilden die wahrscheinlichkeits- 
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theoretischcharakteristischen Eigenschaften des Fadens einen stationären 
Prozeß. 

Verständlicherweise hängt ein beliebiges quantitatives Merkmal des sta- 
tionären Prozesses £(t) nicht vom Zeitpunkt tab, und wenn z. B. £(?) eine end- 
liche Dispersion besitzt, so gelten offenbar die folgenden Gleichungen: 


M&t +u)= M&(l) = M£(0)=a, 
Dt +) = Di) = D&O)= *, 
M{&(tt + u) &0)} = M {&(u) &(0)} . 
Dieser Umstand gestattet es, ohne Einschränkung der Allgemeinheit der fol- 


genden Resultate a=0 und o =1 anzunehmen (dazu genügt es offenbar, 
Ei) — a 
[73 


an Stelle von &(t) den Quotienten zu betrachten). 


Als wichtiges Beispiel betrachten wir den normalen stationären Prozeß. 
Bei beliebigem n (n=1,2,...) sei der Vektor &, = {&t,), - - - , &(£,) normal 
verteilt. Wir setzen voraus, daß 


M&t)=0, Dätl)=1 (-w<t<o), 
sei, und setzen 
M Et) &() = Ru —t). 
Dabei ist R(0) = 1 und R(f) eine gerade Funktion von {. Die Funktion R(f) 
besitzt die Eigenschaft, daß die quadratische Form 
n n 
Z ZRu—t)ua, 
jeli=1 
positiv definit ist. 
Da die charakteristische Funktion des Vektors Z, gleich 


fl mil.) = erp{— EZ RG) uw} 


i=lj=l 
und die charakteristische Funktion des Vektors 8, = {£&(b), ..., &()} bei 
beliebigem k < n gleich 


k &k 
nl; ...; 15 bis ...; t,) = eXp {72 e3 Rt; —i,) u; u;} 
i=1j=- 


= fı(un ---,150,0,...,Ostueuns lern) 
ist, können wir schließen, daß der von uns definierte zufällige Prozeß der Ver- 
träglichkeitsbedingung genügt.!) Außerdem sieht man unmittelbar, daß dieser 
Prozeß stationär ist. 

Ein homogener Markowscher Prozeß, d.h. ein Markowscher Prozeß, bei 
dem für jedes f die Verteilung der Zufallsgröße &(f) ein und dieselbe ist und 
bei dem die Übergangswahrscheinlichkeit F(t,x;r,y) nur eine Funktion der 
drei Argumente x, y und r — t ist, stellt ebenfalls einen stationären Prozeß dar. 


it) Darunter wollen wir die Verträglichkeit aller Verteilungsfunktionen des Prozesses 
verstehen. 
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In vielen theoretischen Fragen und in den praktischen Anwendungen werden 
die mehrdimensionalen Verteilungen (1) nicht betrachtet, und von der Statio- 
närität des Prozesses wird nur benutzt, daß die mathematische Erwartung 
und die Dispersion konstant sind und daß der Korrelationskoeffizient nur von 
der Differenz der Parameterwerte f abhängt. Es ist daher naturgemäß, den 
Begriff der Stationarität zu verallgemeinern. Wir wollen sagen, ein zufälliger 
Prozeß sei stationär im weiteren Sinne, wenn die mathematische Erwartung 
und die Dispersion von £(f) nicht von t abhängen und wenn der Korrelations- 
koeffizient von &(f) und &(£ + u) eine Funktion von u allein ist. 

Doch läßt sich allein aus der Kenntnis der zweiten Momente noch nicht der 
Prozeß £(i) bestimmen; diese Kenntnis kann daher eine Theorie der zufälligen 
Prozesse nicht vollständig ersetzen, die auf der Betrachtung der Wahrschein- 
lichkeitsverteilungen aufgebaut ist. 

Dennoch zeigt es sich in vielen Fragen, daß die Theorie, die allein auf der 
Betrachtung der zweiten Momente beruht — oder, wie man sagt, die Korre- 
lationstheorie — völlig hinreichend ist und diese Probleme befriedigend löst. 

Im vorliegenden Paragraphen beschränken wir uns auf die Untersuchung 
der Korrelationsfunktion, d. h. des Korrelationskoeffizienten zwischen &(f) und 
&( + u) 

_ Mit +wW—ME£lt + wWJ[E) — ME} 


yD st) D&(t + u) 


Auf Grund der Voraussetzung a= 0 und ao =1 vereinfacht sich unser Aus- 
druck für R(u) sehr wesentlich: 


R(u) = M{&(u) &(0)} 


In der Korrelationstheorie nennt man gewöhnlich einen stationären zufälligen 
Prozeß stetig, wenn 


R(u) 


MEd+W— E08 —0 
gilt für u—0. Wie aus der TscHegyscHewschen Ungleichung folgt, gilt 
für einen stetigen Prozeß bei beliebigem e > 0 und beliebigem £ insbesondere 
die Beziehung 


P{kt+W—E0|22>0 (w>0). 
Wie aus der Gleichung 
M {tt + W)— &$)}=2(1— R(u)) 

folgt, gilt für stetige stationäre Prozesse die Beziehung 

lim Ru) =1. 

u>0 

Im Falle eines stetigen stationären Prozesses ist R(u) eine stetige Funktion 
von u. Es ist nämlich 
|R(u + Au) — R(u)| = |M &(u + Au) &(0) — M &(u) &(0)| 
= |M {£(0) [Eu + Au) — &w]]}| - 


21 Gnedenko 
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Doch auf Grund der CavoHY-ScoHuwarzschen Ungleichung ist 


IM {&(0) [u + du) — Ew]}| <yM &°0) M I&u + Au) — Eu]? . 
Da aber 
M2:(0)—=1 
ist und bei stetigen Prozessen für Au —0 
M [&(u + Au) — &u)]’ > 0 
gilt, folgt für Au —>0 
|R (u + Au) — R(u)| >. 

Damit ist unsere Behauptung bewiesen. 

In dem nun zu beweisenden Satz kann die Stationarität sowohl im weiteren 
als auch im engeren Sinne aufgefaßt werden. 

Satz von CHıntscHin. Eine Funktion R(u) ist dann und nur dann eine 
Korrelationsfunktion eines stetigen stationären Prozesses, wenn sie sich in der 
Form 

R(u) = [ cosuxdF(x) (3) 

mit einer gewissen Verteilungsfunktion F(x) darstellen läßt. | 

Beweis. Die Bedingung des Satzes ist notwendig. Ist nämlich R(u) die 
Korrelationsfunktion eines stetigen stationären Prozesses, so ist sie stetig und 
beschränkt. Wir können außerdem beweisen, daß sie sogar positiv definit ist. 
Denn wie auch immer die reellen Zahlen 1, it, ... , U„, die komplexen Zahlen 
NN +. +, 9m und eine ganze Zahl n gewählt sein mögen, stets gilt die folgende 
Beziehung: 


0<M B nr &uy)l* = M 2 2m 7 Eu) 8} = 2 2 Ru — LTE 
= delj= =, 


Auf Grund des Satzes von BoCHNER-CHINTscHIN ($39) folgt hieraus, daß 
R(u) sich in der Form 

R(u) = f e*"dF(«) 
darstellen läßt, wobei F(x) eine nicht abnehmende Funktion mit beschränkter 
Variation bezeichnet. Da die Funktion R(u) reell ist, erhalten wir hieraus 


R(u) = f cos uxdF@)'). 
Beachtet man schließlich noch die Bedingung 
R+Q)=1, 
so findet man F(+ 00) — F(— oo) = 1,d.h., F(«) ist eine Verteilungsfunktion. 
Die Bedingung ist hinreichend. Es sei bekannt, daß R(u) eine Funktion 
der Form (3) ist. Es ist zu beweisen, daß ein stationärer Prozeß &(f) existiert, 


dessen Korrelationsfunktion gerade A(ıt) ist. Dazu betrachten wir zu jedem 
ganzen rn und jeder Gruppe von reellen Zahlen 2, f,, ... , 4%, einen normal ver- 


1) Auf Grund des Resultates des Beispiels 3, $ 36, ist die Funktion F(x) symmetrisch 
d.h.Fx+0)=1— Fix). 
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teilten n-dimensionalen Vektor £(t,), &(t,), - - - , &(£,), der die Eigenschaften 

Midi) = M&lt) = = M&l) = 0, 

D &tt) = Dit) =. = Di) =1 
besitzt; für beliebige i und 7 sei der Korrelationskoeffizient zwischen &(f;) und 
&(£,) gleich R(t; —1,), d.h. 

M &t) &,) = Rh —t,). 

Die Gestalt der Funktion R(u) garantiert die positive Definitheit der quadra- 
tischen Form, die im Exponenten des n-dimensionalen Normalgesetzes steht. 
Der so definierte normale zufällige Prozeß ist sowohl im engeren als auch 
im weiteren Sinne stationär. 

Der bewiesene Satz spielt in der Theorie der stationären Prozesse und in 
deren physikalischen Anwendungen eine grundlegende Rolle. Für Einzelheiten 
verweisen wir auf die Spezialliteratur, fürs erste auf die am Ende des Buches 
angegebene Literatur. 

Beispiel]. Es sei 

Eh) = EcosAt-+msinit, 

& und n seien dabei nicht korrelierendet) Zufallsgrößen mit MEe=Mn=0, 
DE=Dn=1,}sei eine Konstante. Wegen 
R(u) = M&(t + u) &) 

= Ml[£cosAt+ nsinAtl[EcosAlt Hu) +nsinAll + ı)l 

= M|[& cosAftcosAl+W)+&n (sin AtcosAll+ u) + cosAlsinA(l + u)) 

+2? sinAtsinA(£ + u)] = cosAtcosA(t + u) + sinAisinA(+ u) =cosAu 

ist der Prozeß £(l) stationär im weiteren Sinne. Für ihn müssen wir in der 


Formel (3) ; 
0 fürrr s—A, 


F@)=!1- für—ı<aza, 


1 für >4 
setzen. 


Beispiel2. Es sei 
n 
&H = & br El) 

k=1 
mit &() = &, 008 A, 1 + n,sinA,t. A, seien Konstante, es si Zb4=1 und 
die Zufallsgrößen &, und 7, mögen den Bedingungen 

M&,=My=0,D4,=Dy=1 (k=1,...,n), 
M&&= My, =0füri+j, Min =lfürijel,...,n 

genügen. 


1) Zwei Zufsllsgrößen & und n heißen nicht korrelierend, wenn M&y=MEMn. 
21* 
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Man rechnet leicht nach, daß die Korrelationsfunktion des Prozesses &(f) 
gleich 
n 
R(u) = 5 bi cosA, u 
k=1 
ist, daß also der Prozeß &(f) im weiteren Sinne stationär ist. Die Funktion F(x) 
in der Formel (3) wächst nur in den Punkten + A, und besitzt dort Sprünge 


1 
der Größe — bi. 
Zufällige Prozesse, bei denen die Funktion F(x) nur sprunghaft wächst, 


heißen Prozesse mit diskreiem Spektrum. 
Man sieht leicht ein, daß jeder Prozeß der Gestalt 


= z bu 64) (4) 


mit db =1, wo die £&;(f) die gleiche Bedeutung wie im Beispiel 2 haben, 
stationär im weiteren Sinne ist und ein diskretes Spektrum besitzt. Es ist 
wichtig festzustellen, daß E. E. Sıurskı die tiefliegende Umkehrung dieses 
Satzes bewies: Jeder stationäre Prozeß mit einem diskreten Spektrum ist in der 
Form (4) darstellbar. Eine Verallgemeinerung dieses Satzes von E. E. SLUTSKI 
auf den Fall eines beliebigen Spektrums wird im folgenden Paragraphen for- 
muliert. 

Parallel mit der Entwicklung der Theorie der stationären Prozesse entwickelte 
sich die Theorie der stationären Folgen. Eine Folge von Zufallsgrößen 


., Eis &£_» Ey & & ... (5) 


heißt stationär, wenn bei beliebigen ganzen n, u und 4(1<j<n) die Be- 
dingung (1’) erfüllt ist. Entsprechend heißt eine Folge (5) stationär im weiteren 
Sinne, wenn für alle Glieder der Folge die mathematischen Erwartungen und 
die Dispersionen konstante Zahlen sind, die nicht von der Stelle in der Folge 
abhängen 

M&,=ME,Ä=M&,=MAL=MR=-.- =a, 

DE,= Di, = Du, = Di = Di,=-...=o®: 


und wenn der Korrelationskoeffizient zwischen &, und £, nur eine Funktion 
von ii — j| ist. 

Als Übung schlagen wir dem Leser vor, den folgenden Satz zu beweisen: 
Wenn für eine stationäre Folge 


... 


I 


lim R(s) = 0 


s>o@ 
ist, wobei R(s) der Korrelalionskoejfizient zwischen &, und &;,, ist, so gilt 


1 n 


== | —1 
= 


für jedse>0. 
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8 58. Der Begriff des stochastischen Integrals. 
Spektralzerlegung der stationären Prozesse 


Für das Folgende müssen wir den Begriff des stochastischen Integrals ein- 
führen. 

Im Intervall a<t<b seien ein zufälliger Prozeß und eine Zahlenfunk- 
tion /(i) vorgegeben. Wir unterteilen das Intervall [a, 5] durch die Punkte 
a=4,<h<:--.-<t, = b und betrachten die Summe 


£ -2 fa) El) ku): 


Wenn diese Summe für max (, — i;,_,)—0 gegen einen Grenzwert strebt 
1<i<n 

(der im allgemeinen selbst wieder eine Zufallsgröße ist), so heißt dieser Grenz- 

wert ein Integral des zufälligen Prozesses &(f); er wird mit 


1= [1080 


bezeichnet. Das uneigentliche Integral (für a = — 0%,b= + 00) wird wie 
üblich als Grenzwert der eigentlichen Integrale für a >— ©,b-> + 00 defi- 
niert. 

Die Konvergenz der Integralsummen /, wollen wir in folgendem Sinne 
verstehen: Es existiert eine Zufallsgröße I derart, daß für n — oo 

M(I,— 12°? —0 (1) 
gilt. 

Gestützt auf bekannte Sätze aus der Theorie der Funktionen einer reellen 
Veränderlichen kann man leicht beweisen, daß die Folge der Zufallsgrößen I, 
dann und nur dann gegen den Grenzwert I im Sinne von (1) konvergiert, 
wenn für min (m, n) — 00 

M(I„— In)? —0 (2) 
gilt. Mit dem Beweis dieser Tatsache wollen wir uns hier nicht aufhalten. 


Satz 1. Hinreichend für die Existenz des Integrals 


b 
I= ff) &0 dt 
“ 
ist die Existenz des Integrals 


bb 
"A =-/[ Rt 91010 ds dt. 
Dabei ist 
} 
A = MI KO 80 di). 


Beweis. Zum Beweis der ersten Hälfte des Satzes brauchen wir nur fol- 
gendes zu zeigen: Wenn das Integral A existiert, so gilt die Beziehung (2). 
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Wir haben 
MI, — Im)?= M [2 Mi) &4) At]? — 2 M2 zZ Ki) ICs) Ei) &Cs,) At; As; 


+ M LE Ks) &6s)) Asjl? 


as Z fl) I) RU —T) A An —2 Z E Ki) I) R(«— 5) Atı 45; 


i=1 1 
T x E fs) Kar) R(s; — 0) As; do; . 
jelk=1 
Hier fallen die Zahlenwerte f,; und 7, sowie s, und o, zusammen. 
Auf Grund der Voraussetzung über die Existenz des Integrals A ist 
A=lm2 = f&) Ku) R(k — r,) Al; Ar, 
v.ı9 
—= lim Z - fs) Kor) R6s; — 0%) ds; Ao; » 
J 
wenn nur max [At;, Aa,] > 0. Also gilt für min (m, n) — oo 
MI„— I? —®. 
Zum Beweis der zweiten Hälfte des Satzes bemerken wir, daß 
M [z IE) Et) at)® = ME ft) Kr) Ed) Eu) At; Ar; 
a; 
= 2 2 ft) Ku) Ri — %;) Al; do; 
3 


ist; für max At, —0 strebt die letzte Summe gegen das Integral A. 
1<isn 
Zugleich mit dem soeben eingeführten Begriff des stochastischen Integrals 


kann man auch das stochastische STIELTIES-Integral betrachten; wir definieren 
es als Grenzwert der Summen 


NW IE) — Ed] @) 


für max (,—4;_,)—0. Hier ist wie oben a=4,<..<4=b und der 
Limes ist im Sinne von (1) zu verstehen. Wenn der Grenzwert der Summen (3) 
existiert, so wollen wir ihn mit dem Symbol 


b 
St de) 


bezeichnen. 

Am Ende des letzten Paragraphen formulierten wir den Satz von E.E. 
SLuTskKt, der den Zusammenhang aufklärt, der zwischen den stationären Pro- 
zessen mit diskretem Spektrum und den FoURIER-Reihen mit zufälligen, aber 
nicht korrelierenden Koeffizienten besteht. Es läßt sich beweisen, daß jeder 
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im weiteren Sinne stationäre Prozeß die folgende Eigenschaft besitzt: Bei 
beliebigem e > 0 und für jedes (noch so große) T' gibt es paarweise nicht korre- 


lierende Zufallsgrößen &,, &3 - » &n5 N» Nas - - - ; 7! und reelle Zahlen A,, A, ..., An!) 
so daß bei beliebigem i aus dem Interval— T <?<T die Ungleichung 


ME) — & (&, cos A, + ne sin A, DJ’ <e 
besteht. Hieraus ergibt sich insbesondere, daß unter den angegebenen Bedin- 
gungen 
Pf|E) — I (Er 6054, 2+ 7, sin, | <m} < m 
ist, dabei ist 7 eine vorgegebene positive Zahl. Wir führen ohne Beweis den 


folgenden wichtigen Satz an. 

Satz 2. ‚Jeder im weiteren Sinne stationäre Prozeß läßt sich in der Form 

Ei) = [oosardz,(a) -F f sinA£dZ,(A) (4) 

darstellen, wobei die zufälligen Prozesse Z,(A) und Z,(A) (mitA > 0) die folgenden 
Eigenschaften besiizen: 

a) MIZi(A, + AA) — ZA) TEA + A) — ZA)]=0 Gj=12) 
falls i# j ist; wenn jedoch die Intervalle (A,,A, + AA,) und (AA, + AA,) dis- 
junkt sind, so können i und j auch gleich sein; 

b) MIZ@ + AA) — ZA)? = MI[ZyA + 4) — Z()]*. 
Die Formel (4) nennt man Spektfralzerlegung des Prozesses &(f). Die in der 


Formel (4) auftretenden Prozesse Z,(4) und Z,(2) lassen sich mit Hilfe der 
Gleichungen 


2 
A 1 sin At 
2,0) = Jim 5. j Fat 


Tr 
und 
2 1 Zi 
e 1 — cos 
2.) = lim 5, J — rt cp dt 
-T 


bestimmen. Man kann leicht beweisen, daß die beiden angegebenen Integrale 
existieren (dies geschieht mit der im vorigen Paragraphen bewiesenen Formel 
von CHINTscHIn). Man kann auch zeigen, daß 


F(@ + AA) — F(A) = MI[Z,(A + 44) — ZA]? 


ist, wo F(x) die durch den Satz von CHinTscHin definierte Funktion ist. 
Auf die Möglichkeit der Zerlegung (4) für beliebige im weiteren Sinne sta- 
tionäre zufällige Prozesse wies im Jahre 1940 A.N. Koumocororr hin. Er 


1) Die Zahlen n und A, ... ‚A, sowie die Größen &; und n; hängen von e und T' ab. 


314 X. Die Theorie der stochastischen Prozesse 


formulierte dieses Ergebnis in der Terminologie der Geometrie des HILBERT- 
Raumes und bewies es mit Hilfe der Spektraltheorie der Operatoren. Der 
wahrscheinlichkeitstheoretischen Deutung und Ableitung dieser Zerlegung wur- 
den in der Folgezeit die Arbeiten vieler Autoren gewidmet — unter ihnen 
H. CRAM&rR, KARHUNENnN, M. Lo&ver, A. BLANnc-LAPIERRE. 

Wir werden hier nicht über die Anwendungen der Spektralzerlegung auf die 
Probleme der Schwingungslehre und der Geophysik sprechen, sondern ver- 
weisen den Leser auf die Arbeiten von A.M. JacLom, A. BLAno-LAPIERRE 
und R. FoRTET, die im Literaturverzeichnis am Ende des Buches angegeben sind. 


8 59. Der Ergodensatz von BIRKHOFF-CHINTSCHIN 


Im Jahre 1931 bewies der amerikanische Mathematiker GEORGE BIRKHOFF 
einen allgemeinen Satz der Mechanik, der — wie drei Jahre später A. J. Cum- 
TSCHIN zeigte — eine weitreichende wahrscheinlichkeitstheoretische Verall- 
gemeinerung zuläßt. Dieser Satz besteht in folgendem: Wenn ein sietiger 
stationärer Prozeß eine endliche mathematische Erwartung besitzt, so existiert mit 
der Wahrscheinlichkeit Eins der Grenzwert 

7 


i 1 
re 
0 


Die Stationarität des Prozesses wird hier im engeren Sinn verstanden. 

Da dieser Satz eine eigenartige Form des starken Gesetzes der großen Zahlen 
darstellt, beweisen wir ihn — um sofort an die Formulierungen des Kapitels VI 
anzuknüpfen — nicht für stationäre Prozesse, sondern für stationäre Folgen. 


Satz. Vorgegeben sei eine stationäre Folge von Zufallsgrößen 


« en Ey & ... 


mit endlichen mathematischen Erwartungen M &,. Dann konvergiert mit der Wahr- 
scheinlichkeit Eins die Folge der arithmetischen Mittel 


n 
1 
Bu > Er 
ni 
gegen einen Grenzwert. 


Beweis.!) Wir setzen 
ke &tSrıt+&-ı 
Te 0° 
Wir müssen beweisen, daß mit der Wahrscheinlichkeit Eins die Größen hy, 
für b — oo gegen einen Grenzwert streben. Das zufällige Ereignis, das in der 
Existenz dieses Grenzwertes besteht, wollen wir mit dem Buchstaben K 


bezeichnen. Wir müssen beweisen, daß P(K) =1 oder, was dasselbe ist, 
P(K) = 0 ist. 


1) Dieser Beweis stammt von B. W. GnEpEnko (Anm. d. Red.). 
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Wir wollen das Gegenteil annehmen, das Ereignis K (d. h., daß die Größen hy, 
für b — oo divergieren) besitze eine positive Wahrscheinlichkeit, und wir wollen 
zeigen, daß diese Annahme zu einem Widerspruch führt. 

Dazu betrachten wir alle Intervalle [a„, d,] mit rationalen Endpunkten, 
&n < m. Die Menge aller dieser Intervalle ist abzählbar. Wenn lim h,, nicht 


b>+ co 


existiert, so läßt sich sicher ein Intervall [,, ß„] finden, so daß lim sup hy5 > Pa 
b—> co 
und lim inf hy, < a, ist (das Ereignis K,„). Somit ist das Ereignis K die Ver- 


b>o 
einigung von abzählbar vielen Teilereignissen X,. Da nach Annahme P(XK) > 0 
ist, läßt sich sicher ein n finden mit P(K,) > 0. 
Damit haben wir folgendes bewiesen: Ist P(K) > 0, so gibt es zwei Zahlen & 
und 8 (« > ß), für die gleichzeitig die Ungleichungen 


lim suphu,>Bß, } 


d 
= liminfho» <o 


() 
mit einer Wahrscheinlichkeit > 0 erfüllt sind. Dieses Ereignis nennen wir E. 

Wir wollen nun annehmen, die £; hätten irgendwelche bestimmten Werte 
angenommen. Ist das Intervall [a, 5] so gewählt, daß h,,> ß, aber für alle 
’mita<b’<bh,»<Pß ist, so wollen wir dieses Intervall ausgezeichnet 
(bezüglich 8) nennen. 

Man prüft leicht nach, daß sich zwei ausgezeichnete Intervalle nicht über- 
lappen. Sind nämlich [a, 5] und [a,, 5] zwei ausgezeichnete Intervalle mit 
a<a<b< b, so ergibt sich aus der Gleichung 


(a, —a) hau, + (b— a,) ha, 


h,,= 
ab b—g 


und der Ungleichung h,, > ß, daß entweder h,.> ß oder h„» > ß ist. Die 
erste dieser Ungleichungen ist jedoch unmöglich, denn das Intervall [a, 5] ist 
ausgezeichnet, aber auch die zweite Ungleichung ist unmöglich, denn das 
Intervall [a,, b,] ist ausgezeichnet. 

Die Differenz d— a nennen wir die Länge des Intervalls [a,b]. Wenn das 
Intervall [a, 5] 


1. ausgezeichnet ist, 


2. eine Länge nicht größer als s besitzt und 


3. nicht in einem ausgezeichneten Intervall mit einer Länge < s liegt, 
so nennen wir ein solches Intervall s-ausgezeichnet. 

Unter den ausgezeichneten Intervallen, die ein beliebiges Intervall [A, B] von 
einer Länge nicht größer als s überdecken und die selbst eine Länge besitzen, 
die nicht größer als s ist, muß es ein größtes geben; denn gäbe es zwei solche, 
so müßten sie sich überlappen, was nach dem soeben Bewiesenen unmöglich 
ist. Jedes ausgezeichnete Intervall von einer Länge nicht größer als s kann 
sich also nur innerhalb eines s-ausgezeichneten Intervalls befinden (oder mit 


316 X. Die Theorie der stochastischen Prozesse 


ihm zusammenfallen). Aus der Definition folgt, daß je zwei verschiedene 
s-ausgezeichnete Intervalle disjunkt sind. 

Wir bezeichnen mit K, das Ereignis, das darin besteht, daß die Unglei- 
chungen (1) erfüllt sind und daß außerdem ein 2<:s existiert mit h,> Pf. 
Da E der Limes der Ereignisse K, ist, wird 

P(E) = lim P(K,). 
s—> 0x0 
Hieraus folgt, daß für alle hinreichend großen s die Ungleichung P(K,) > 0 
besteht. Im folgenden beschränken wir uns in unserer Betrachtung nur auf 
solche Werte s. 

Das Ereignis K, trete ein. Dann existiert unter den 2<s mit h,>ß ein 
kleinstes #. Das Intervall [0, #] ist ausgezeichnet. Folglich liegt es in einem 
s-ausgezeichneten Intervall [a, b] (oder ist selbst ein solches), für dassa <0<b. 
Es gilt auch das Umgekehrte: Wenn es ein s-ausgezeichnetes Intervall [a, 5] 
gibt mit a<0<b, so gibt es auch ein 2<smit h„> ß. Für a = 0 ist dies 
evident: Man braucht nur {= 5 zu setzen. Ist aber a< 0, so folgt aus der 
Gleichung 
—ahso +bhe 

b—a 


= 


und aus den Ungleichungen h,, > ß, ha. <Pß auch h,, > $. Daher kann man 
auch in diesem Falle i = b setzen. 

Wir bezeichnen —« mit p, b—a mit q. Da nur ein s-ausgezeichnetes Intervall 
(—p, —p-+9g) existieren kann, zerfällt das Ereignis K, in unvereinbare Fälle 
K,g die dem Auftreten der verschiedenen möglichen s-ausgezeichneten Inter- 
valle (—p, — p + g) entsprechen: 


K=SKu, @=1...,5P=01...,9—D. 
B,4 


Eine Abänderung in der fortlaufenden Numerierung ” =i-+ p führt den 
Fall K,, in den Fall K,, über. Daher ist auf Grund der Stationarität P(K,,) 
— P(K,,) und M&u/K,, = M &ulKoag-) 

Es ist 


P(K) M(@&ulR,) = Z P(K,.) M@&ulK,,) = & PK) M(&!Ku) 
2,49 q 
- = PK) M(d haglKoo) 


Beachtet man ferner, daß im Falle K,, die Ungleichung h,, > ß besteht, so 
findet man die Beziehung 


P(R,) M@slK,) > = P(K,)4B = pz PR, )=PP(R,). 


1) Wir weisen darauf hin, daß wir nur an dieser Stelle die Voraussetzung der Stationarität 
benutzen. 
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Da nach Voraussetzung P(K,) # 0 ist, ergibt sich hieraus 
M&oK)>P. 
Wegen K,—K wird 
MG@IR) SP. 
Ähnlich läßt sich beweisen (wenn wir die ausgezeichneten Segmente bezüglich 


& betrachten), daß 
M(@&/K) > a 


ist. Wir sind damit zu einem Widerspruch gelangt. Hieraus folgt P(K) = 0, usw. 

Die Frage, wie dieser Grenzwert aussieht, gegen den die Größen Ah,, für 
n — co streben, muß gesondert betrachtet werden. Wir beschränken uns hier 
lediglich auf den Beweis des folgenden Satzes. 


Satz. Wenn die Zufallsgrößen &, stationär sind, endliche Dispersionen besitzen 
und wenn die Korrelationsfunktion R(j) für j — oogegen 0 konvergiert, so ist 


pfin>A_] (=Miy. 


nom 


Beweis. Wir betrachten die Dispersion der Zufallsgröße Ag,. Auf Grund 
der Stationarität haben wir 


Dia Mi 3-0] ->eln+2 3: Ro]. 


k=1 zi<jsin 
Offenbar ist 


& Ri—)= Zn n Rt. 


ı1<i<j<n 
Wir betrachten nun ein so großes m, daß für k > m die Ungleichung 
|Ro|<e (>00) 
besteht. Hieraus ergibt sich die Beziehung 


Dim<Seln+2 S(n—MRk)+2e Gr 
elrn 2, 


k=m+1 


Diese Ungleichung läßt sich offenbar folgendermaßen noch vergröbern 
D 
Din < a In +2m(n—1) +e(n—m—1)(n—m)]. 


Ist n genügend groß, so ist klar, daß die rechte Seite dieser Ungleichung kleiner 
als 3& gemacht werden kann. Für n — oo konvergieren also die Größen hy, 
in Wahrscheinlichkeit gegen a. Da aber die h,„ für n — oo mit der Wahr- 
scheinlichkeit Eins konvergieren, so schließen wir hieraus auf die Richtigkeit 
der Aussage des Satzes. 
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Der bewiesene Satz ist nicht nur von bedeutendem theoretischen Interesse, 
sondern findet auch weitgehend Anwendung in der statistischen Physik und 
in der technischen Praxis. Der Grund dafür besteht darin, daß man zur Be- 
stimmung so wichtiger charakteristischer Größen einer Erscheinung wie M £&(i), 
D £(t), R(n) im Falle stationärer Prozesse nicht die Wahrscheinlichkeitsvertei- 
lungen der möglichen Werte zu kennen und diese Größen nach entsprechenden 
Formeln auszurechnen braucht. Die Bestimmung dieser — wie man in der 
Physik sagt — räumlichen Mittel erfordert vom Forscher Daten, die er häufig 
nicht hat. Auf jeden Fall erfordert die praktische experimentelle Abschätzung 
dieser Größen eine mehrfache Verwirklichung der Versuche an dem Prozeß 
(d. h. es müssen experimentell viele Realisierungen der Funktion &(f) gewonnen 
werden). Der Ergodensatz von BIEKHOFF-CHINTSCHIN zeigt, daß man sich 
dabei mit der Wahrscheinlichkeit Eins (unter bestimmten Bedingungen) auf 
eine einzige Realisierung des Prozesses &(f) beschränken kann. 


XI. 
ELEMENTE DER STATISTIK 


$ 60. Einige Aufgaben der mathematischen Statistik 


Das Wort „Statistik‘‘ stammt von dem lateinischen Wort Status — Zustand. 
Ursprünglich verband man im 18. Jahrhundert, als sich die Statistik zu einer 
wissenschaftlichen Disziplin zu entwickeln begann, den Begriff der Statistik 
mit der Beschreibung der Umstände, die den Zustand eines Staates charak- 
terisieren. Dabei wurde noch nicht erkannt, daß der Gegenstand der Statistik 
nur in den Erscheinungen von Massencharakter besteht. Heutzutage hat die 
Statistik einen größeren und gleichzeitig sehr viel bestimmteren Inhalt. Man 
kann nämlich sagen, daß die Statistik folgende drei Aufgaben behandelt: 


1. Die Sammlung statistischer Daten, d.h. von Angaben, die ein- 
zelne Besonderheiten irgendwelcher Massenerscheinungen charakterisieren; 


2. die statistische Untersuchung der gewonnenen Daten; sie 
besteht in der Aufdeckung der Gesetzmäßigkeiten, die man auf Grund der 
gegebenen Massenbeobachtungen feststellen kann; 


3. die Ausarbeitung von Verfahren zur statistischen Kontrolle 
und zur Analyse der statistischen Daten. 

Dieses letzte Gebiet stellt im Grunde auch den Inhalt der mathematischen 
Statistik dar. 

Statistische Daten, hauptsächlich über die Bevölkerung, sammelte man 
schon vor langer Zeit; es existieren Überlieferungen über eine Volkszählung 
im Jahre 2238 v. d. Z. in China unter dem Kaiser Jao; Volkszählungen wurden 
auch im alten Ägypten, im alten Persien und im römischen Imperium durch- 
geführt; Volkszählungen in Rußland sind aus den Jahren 1245, 1259, 1273 
und 1287 und aus späteren Jahren bekannt. Man muß sich jedoch klar darüber 
sein, daß diese Volkszählungen äußerst primitiv waren und daß man z.B. in 
China im Verlauf von 200 Jahren die Bevölkerung nur dadurch abschätzte, 
daß man die Listen der vorhergehenden Volkszählung abschrieb. Jedoch selbst 
solche unvollständigen und primitiven Volkszählungen ermöglichten es, wich- 
tige Maßnahmen zu treffen. 

In den vorangegangenen Kapiteln haben wir eine Reihe wichtiger Begriffe 
für die zahlenmäßige Charakterisierung der Zufallsgrößen und zufälligen 
Ereignisse eingeführt. Zu diesen Begriffen gehören in erster Linie die Wahr- 
scheinlichkeit, die Verteilungsfunktion, die mathematische Erwartung, die 
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Dispersion u.a. In den meisten Fällen kann man nur behaupten, daß ein 
vorgegebenes Ereignis eine Wahrscheinlichkeit besitzt oder daß eine Größe, 
deren Werte vom Zufall abhängen, eine Verteilungsfunktion besitzt. Nur 
selten gelingt es, diese Wahrscheinlichkeit oder die Verteilungsfunktion tat- 
sächlich anzugeben. In der Praxis ist es gewöhnlich so, daß alle von uns 
eingeführten Zahlencharakteristiken auf Grund von experimentellen Daten 
abgeschätzt werden müssen. Die Ausarbeitung von Methoden für solche 
Abschätzungen stellt eine der wichtigsten Aufgaben der mathematischen 
Statistik dar. 

Auch wenn es gestattet erscheint, die Zahlencharakteristiken apriori anzu- 
geben, entsteht doch die folgende Aufgabe der mathematischen Statistik: 
Es ist mit Hilfe geeigneter Versuche festzustellen, ob in Wirklichkeit alle die 
Bedingungen vorhanden sind, auf Grund deren man die apriorische Angabe vor- 
genommen hat. Es sei z.B. ein Tetraeder vorgegeben. Auf Grund der An- 
nahme, daß das Tetraeder geometrisch einwandfrei gebaut und die Massen 
in ihm gleichmäßig verteilt sind, schließen wir darauf, daß das Tetraeder beim 
Wurf mit der Wahrscheinlichkeit */, auf jede seiner Flächen fallen kann. Doch 
entsprechen die von uns gemachten Annahmen der Wirklichkeit? Diese Frage 
kann man nicht allein durch Überlegungen beantworten, dazu muß man die 
Versuchsdaten zu Hilfe nehmen. 

In diesem Kapitel geben wir nur eine allgemeine Vorstellung von den Auf- 
gaben der mathematischen Statistik und verweisen für eine systematische Dar- 
stellung und für Einzelheiten auf die Spezialliteratur. Wir beschränken uns 
lediglich auf die Betrachtung der folgenden Aufgaben: 


1. Abschätzung einer unbekannten Verteilungsfunktion. 


Die Aufgabe ist die folgende: Als Ergebnis von n unabhängigen Versuchen 
an einer Zufalisgröße £ erhalte man die Werte 


ST N RR 


Es ist die unbekannte Verteilungsfunktion F(x) der Größe € approximativ 
abzuschätzen. 


2. Abschätzung der unbekannten Parameter einer Verteilung. 

Allgemeine theoretische Überlegungen gestatten es häufig, ziemlich genaue 
Schlüsse über den Typus der Verteilungsfunktion der uns interessierenden 
Zufallsgröße zu ziehen. So kann man z. B. auf Grund des Satzes von LIAPUNOW 
annehmen, daß in bestimmten Fällen die Verteilungsfunktion normal sein 
muß. Die Abschätzung der unbekannten Verteilungsfunktion reduziert sich 
dann auf die Abschätzung der allein noch unbekannten Parameterwerte aund o 
auf Grund der Beobachtungsergebnisse. 

Die allgemeine Aufgabe besteht in folgendem: Eine Zufallsgröße & besitzt 
eine Verteilungsfunktion eines bestimmten Typus, die von k Parametern 
abhängt, deren Werte unbekannt sind. Auf Grund einer Anzahl von Beob- 
achtungen an der Größe & sind die Werte dieser Parameter abzuschätzen. 
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Offenbar ist die Abschätzung der unbekannten Wahrscheinlichkeit p eines 
Ereignisses A ein Spezialfall der eben formulierten Aufgabe, da wir eine Zu- 
fallsgröße & betrachten können, die den Wert 1 annimmt, wenn das Ereignis A 
eintritt, und die gleich Null ist, wenn das Ereignis A nicht eintritt. Die Ver- 
teilungsfunktion von £ hängt von dem einzigen Parameter p ab. 

Die Lösung der soeben gestellten Aufgabe geben wir nur für die Normal- 


verteilung 
(@—.a) 
1 zz 


Iela, 0) = yon e 

an. In diesem Falle läßt sich die Aufgabe offenbar in drei Teilfragen zerlegen: 

1. Die Größe o werde als bekannt vorausgesetzt, es ist der unbekannte 
Wert von a abzuschätzen; 

2. die Größe a werde als bekannt vorausgesetzt, abzuschätzen ist der un- 
bekannte Wert von 0; 

3. beide Parameter sind unbekannt, man schätze ihre Werte ab. 

Etwas präziser lassen sich diese Fragen folgendermaßen formulieren: In n 
unabhängigen Versuchen möge die Zufallsgröße & die Werte 


I br Pe 2 
angenommen haben. Es wird nun verlangt, Funktionen @ = a{&,,...,%,) und 
o=0(%,...,%,) anzugeben (in der ersten Aufgabe kann a auch eine Funktion 
von o sein, in der zweiten Aufgabe o auch von a abhängen), die man vernünftiger- 
weise als Näherungswerte der abzuschätzenden Größen a und o nehmen kann. 
Außerdem ist die mittlere Genauigkeit dieser approximativen Formeln zu be- 
stimmen. 

Manchmal ist es vorzuziehen, nicht die Näherungswerte der unbekannten 
Parameter a und o in Form der Funktionen @ und o zu suchen, sondern solche 
Funktionen a’, a” (0° und 0”) der Beobachtungsresultate und der bekannten 
Größen anzugeben, so daß man mit praktisch ausreichender Sicherheit behaup- 
ten kann, daß 


a’ < a < a’ 
und entsprechend 
6’ < oc < oe’ 


ist. Die Funktionen a’, a’ (o’, 0’) heißen die Verirauensgrenzen von a bzw. o. 
Wir geben im folgenden zwei Methoden an, mit denen man an die Lösung dieser 
Aufgabe herangehen kann. 


3. Nachprüfung statistischer Hypothesen. 

Die Aufgabe, die wir hier betrachten, ist folgendermaßen gestellt: Auf Grund 
gewisser Überlegungen nimmt man an, daß die Verteilungsfunktion einer Zu- 
fallsgröße & gleich F(x) ist; man fragt sich dann, ob die Beobachtungswerte 
mit der Hypothese verträglich sind, daß £& tatsächlich die Verteilungsfunktion 
F(&) besitzt. 


322 XI. Elemente der Statistik 


Wenn speziell an der Form der Verteilungsfunktion kein Zweifel besteht und 
nur die Werte einiger Parameter nachzuprüfen sind, die die Verteilung charak- 
terisieren, so wird in der Aufgabe gefragt: Widersprechen die Beobachtungs- 
resultate der Hypothese, daß die Parameter der Verteilung die vorausgesetzten 
Werte besitzen? Dies ist die Aufgabe der Nachprüfung der einfachen Hypo- 
these. Wenn die nachzuprüfende Hypothese darin besteht, daß die Parameter 
nicht genau bestimmte Werte annehmen, sondern nur in ganz bestimmten 
Mengen liegen (z. B. im Falle der Binomialverteilung die Hypothese p < p,), 
so heißt eine solche Hypothese zusammengesetzt. 

Mit den drei aufgezählten Aufgaben sind natürlich bei weitem noch nicht alle 
Grundprobleme der mathematischen Statistik erschöpft. Völlig neue Aufgaben 
stellt die industrielle und die wissenschaftliche Praxis der mathematischen 
Statistik. Man braucht z.B. nur darauf hinzuweisen, daß der Ausschuß bei 
einer Produktion von Massenartikeln sowie die Kontrolle der Qualität der aus- 
gestoßenen Produktion nicht nur die Bestimmung einiger unbekannter Para- 
meter oder Verteilungsfunktionen verlangt; hier muß der rationellste Verlauf 
des Produktionsprozesses gefunden werden. Daneben ist die Ausarbeitung 
rationeller Methoden der Auswertung des Beobachtungsmaterials sowie die 
Planung der Versuche selbst eine der grundlegenden Aufgaben der mathema- 
tischen Statistik. 

Wir gehen hier überhaupt nicht auf die Statistik abhängiger Versuche und 
auf statistische Aufgaben ein, die mit der Schätzung zufälliger Prozesse zu- 
sammenhängen und setzen uns auch nicht das Ziel, dem Leser eine gewisse 
Fertigkeit in der praktischen statistischen Arbeit zu vermitteln. 
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Ausgangspunkt der statistischen Untersuchung irgendeiner Zufallsgröße & 
ist eine Gesamtheit von rn Beobachtungen, bei denen die Zufallsgröße & die 
Werte 


De en (1) 
annimmt. 

Wir setzen im folgenden stets voraus, daß die Versuche voneinander unab- 
hängig sind und unter gleichbleibenden Bedingungen durchgeführt werden. 
Natürlich stellen diese Voraussetzungen in einigen Fällen starke Beschrän- 
kungen dar. Nicht selten steht man vor Aufgaben, in denen Versuche unter ver- 
änderlichen Bedingungen (z. B. beim Schießen auf ein bewegliches Ziel) oder mit- 
einander zusammenhängende Folgen von Versuchen (z.B. die Untersuchung 
eines Garns nach Stichproben bestimmter Länge, genommen von einer Spule 
oder Docke) betrachtet werden müssen. Wenn es auch für Aufgaben unter 
veränderlichen Versuchsbedingungen einige allgemeine Resultate gibt, so ist 
die Statistik der zusarmmenhängenden Versuche noch nicht ausgearbeitet und 
ihre Ausarbeitung ist eine der dringendsten Aufgaben der mathematischen 
Statistik. 
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Die Folge der Versuchsergebnisse ordnen wir der Größe nach. Wenn wir mit 
x; den der Größe nach k-ten Beobachtungswert bezeichnen, können wir die 
Werte (1) folgendermaßen schreiben: 


<B<s'.<sı. 


Diese Folge, d.h. die Folge der ihrer Größe nach geordneten Beobachtungs- 
ergebnisse einer untersuchten Zufallsgröße, heißt Variationsreihe. 

Als empirische Verteilungsfunktion F,(x) bezeichnen wir die durch die fol- 
genden Gleichungen definierte Funktion: 


0 fürz<aef, 
F,fa) = für a <z<af,ı, 
1 Sre>zg.: 


Die empirische Verteilungsfunktion ist monoton, linksseitig stetig und besitzt 
nur in den Punkten Unstetigkeitsstellen, die gleich den Gliedern der Variations- 
reihe sind. a Größen der Sprünge in den Unstetigkeitsstellen sind ganze Viel- 


fache von —. Für das Folgende heben wir die Tatsache hervor, daß bei jedem 
Wert x die Ordinate F,(x) eine Zufallsgröße mit den möglichen Werten 0, — ; 


a —,» ® — ist. Die Wahrscheinlichkeit der Gleichung F,(x) = Fi It wi 


man leicht sieht — gleich 
P [F.@) _ = = CHF} {1 — Fa)jr—#. 


In dem einfachsten Spezialfall, wo die Zufallsgröße £ nur endlich viele Werte 
Q); Ay ..., a, annehmen kann, sind die Glieder der Variationsreihe notwendig 
nur Zahlen dieser Folge. Bezeichnen m,, m,...,m, (m} +---+m,=n) die 
Anzahl der Versuche, für die &=a,...,£=a, ist, dann stellen die relativen 
Häufigkeiten nach dem Gesetz der großen Zahlen für hinreichend große Werte 
von n Näherungswerte der uns unbekannten Wahrscheinlichkeiten p,=Pf£=a,}, 

‚PB =Pf£=a,} dar. Darüber hinaus gilt in unserem Falle auch das starke 
Gesetz der großen Zahlen. In $62 beweisen wir einen allgemeinen Satz über 
die Annäherung der empirischen Verteilungsfunktion an die theoretische mit 
wachsender Anzahl der Versuche. 

Die gewöhnlich in der Statistik benutzten Zahlencharakteristiken einer 
Variationsreihe — das arithmetische Mittel der Beobachtungsergebnisse 


NT RTITE 
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die mittlere quadratische Abweichung 
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22 Gnedenko 
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u.a. — sind Funktionale, die von der empirischen Verteilungsfunktion ab- 
hängen. So ist z.B. 
2=/xdF,(@), 


s?= [ (ce — 2): dF,(@). 


$ 62. Satz von GLıwenko und das Verträglichkeitskriterium von KoLmoGoRoFF 


Bevor wir zur Formulierung und zum Beweis eines wichtigen, von W. I. 
GLiwEnko im Jahre 1933 bewiesenen Satzes übergehen, müssen wir zwei Hilfs- 
sätze notieren. 


Hilfssatz 1. Wenn ein Ereignis E mit dem gleichzeitigen Eintreten unendlich 
vieler Ereignisse E,, E,, .... äquivalent ist, 


E=EE,..., 
und wenn jedes Ereignis E,„,, das vorhergehende E, nach sich zieht, so ist 
P{E} = lim P{E,}. 
no 

Beweis. Das Ereignis E, läßt sich auf zwei Arten in Form einer Summe von- 

unvereinbaren Ereignissen darstellen: 
B=-EBE+EB+-- +EB_E+E, 
und 
E=EE+BEE + +EnıEn+ EBEn4ı+°+E. 
Hieraus gewinnt man 
P{E,} = P{ELE,} + P[ERE,} +» + P{E„_1 E2} + P{ER} 

und 
P{E,}} = P{E, Es} + P{EREs} ++ P{E„_ı En} + PIEr E,41 3 +++ P{E}. 
Ein Vergleich der letzten beiden Gleichungen führt uns zu der Beziehung 


P{E} = P[E.}— & PfErEi un) 


Da der Subtrahend auf der rechten Seite das Restglied einer konvergenten 
Reihe ist, gilt schließlich 


P{E} = lim P{£,}. 


Hilfssatz 2. Wenn jedes Ereignis einer endlichen oder unendlichen Folge 
E,Ey:.., En... die Wahrscheinlichkeit Eins besitzt, so ist die Wahrschein- 
lichkeit ihres gleichzeitigen Einiretens ebenfalls gleich Eins. 

Beweis. Wir betrachten zunächst die beiden Ereignisse E, und E,, für die 


PIE} =PiE} =1 
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ist. Auf Grund der Beziehung 
P{E, + Es} = PIE} + P{E}}— P{E,E,} 
und P{E, + E,} = 1 erhalten wir 


P[E,E} =1. 
Hieraus schließen wir induktiv, daß für beliebige n Ereignisse mit 
P{E,} = P{E,} =... P{E,} =1 


die Gleichung 
P[E„En..„E}=1 


erfüllt ist. Gegeben sei nun eine unendliche Folge von Ereignissen E,,Ey..., 
En... mit 
PE}+= PIE} =: =PlE}=-- =1. 
Da offensichtlich 
E,E,E3... = EEE.) (E, E,E;)-- - 


ist und jedes folgende Ereignis auf der rechten Seite der Gleichung das vorher- 
gehende nach sich zieht, so ist nach dem vorigen Hilfssatz 


P{E, E,E,...}=lim PfE,E,...E,}. 


Diese Gleichung beweist unseren Hilfssatz. 


Satz von W. I. GLIwENKo. F(x) sei die Verteilungsfunktion einer Zu- 
jallsgröße E und F,(x) die empirische Verteilungsfunktion der Resultate aus n 
unabhängigen Beobachtungen an der Zufallsgröße &. Dann gilt für n — oo 


P{ sep |F,@&)—F@|>0=1. 


—- o<r< 


Beweis. Wir bezeichnen mit z,, , die kleinste Zahl x, die den Ungleichungen 
Fix — 0) = F(a) << re +4) (k=12%...,n 
genügt. A bezeichne das Ereignis £ < x, ,. Es ist offensichtlich 
P{A} = F@,,)- 


Da die relative Häufigkeit des Eintretens des Ereignisses A gleich F,(z,, ,) ist, 
erhalten wir nach dem Satz von Boreu die Beziehung 


P{Fu@,) > F@,d} =1- () 


Es sei nun E/ das Ereignis, daß für n — oo 


Fn(&,,) > F@,,») (k=1,2,...,r) 
und 
E'=EiEs...Er. 


232* 
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Das Ereignis E* ist gleichwertig damit, daß für n — oo die Beziehung 
max |F,„(z,, ») — F(&,,.)| >0 


1<k<r 
besteht. Da nach (1) 
P{Ef} = P{E}} =---= P{EN} =1 

ist, erhalten wir auf Grund des Hilfssatzes 2 die Beziehung 

P[E}=1. 
Ferner sei 

E=E!E:E*.... 

Nach Hilfssatz 2 ist 

P{E} =1. 


Schließlich bezeichnen wir mit S das Ereignis, daß für n — oo die Beziehung 
sup |F,(&) — F(x)| >0 

— O<z<o 
besteht. Für ein beliebiges x zwischen den Werten x, , und %,,;, sind die 
Ungleichungen 

Fu(&,, x + 0) < F(&) s Fu(&,,#+1) 

und 

F(&,« +0) < Fa) < F@,,2+1) 
erfüllt, wobei 


0< Fa) FR. +) <- 
ist. Hieraus schließen wir auf die Ungleichungen 
Fo(&r, x + 0) — F(&,,#+1) = F,(&) —F@) < F(@,s+1) — Fa,» + 0) ’ 
d.h., es ist 
1 
|Fn(®) — F@)| < max |Fu@,,») — Fa) + —» 
1<k<r 


und infolgedessen gilt die Beziehung 

1 
sup |F»@&) — F@)| < max |Fu@&,) —F@&,o| +—- 
<z<o ı<k<r r 


Da r beliebig ist, folgt aus der letzten Ungleichung die Beziehung ECS. 
Damit ist die Beziehung 
P/ sup |F,(@) — F@)| a =1 
—X@<z<oo 
offenbar bewiesen. 


Wir erinnern uns daran, daß in den Sätzen über das Gesetz der großen Zahlen 
keine genauen Abschätzungen der Wahrscheinlichkeiten der möglichen Abwei- 
chungen der arithmetischen Mittel der Zufallsgrößen von ihrer mathematischen 
Erwartung angegeben werden. Ähnlich stellt auch der Satz von GLIWENKO 
nur die wichtige Tatsache der Annäherung der empirischen Verteilungsfunk- 
tionen an die Verteilungsfunktion der beobachteten Zufallsgröße fest und sagt 
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nichts darüber aus, mit welchen Wahrscheinlichkeiten die einen oder anderen 
Abweichungen eintreten können. Es ergibt sich daher die Aufgabe, die Ver- 
teilungsfunktion der Größe 
D,= sup |F@a) —F@)| 
—o<re<o 


zu bestimmen. 


Die Lösung dieser Aufgabe erbrachte 1933 A. N. KoLmogororr in Form des 
folgenden Grenzwertsatzes. 


Satz von KOLMOGOoROFF: Ist die Funktion F(x) stetig, so gilt für n — 0 
die Beziehung 


u 0 für E<VU, 
P{YnD,<z} >K@) = 5 (1e-2#® für z>0. 
k=—o 


Wir wollen uns nicht beim Beweis dieses Satzes aufhalten, denn unserer An- 
sicht nach fehlt dazu noch eine genügend elementare Methode. Wir beschränken 
uns hier lediglich auf einen Hinweis, wie der Satz von KoLMoGoROFF für prak- 
tische Zwecke ausgenutzt wird. Dies erscheint um so mehr angebracht, als 
die folgenden Überlegungen in der mathematischen Statistik ständig wieder- 
kehren. 

Es sei gefordert, die Hypothese nachzuprüfen, daß eine Zufallsgröße die stetige 
Funktion F(x) als Verteilungsfunktion besitzt. Zu diesem Zweck werden n 
unabhängige Versuche ausgeführt und mit Hilfe der Ergebnisse die empirische 
Verteilungsfunktion F,(x) konstruiert. Nach dem Satz von W. I. GLIWENko 
ist die Funktion F,(x) eine Approximation der Verteilungsfunktion F(x). Die 
Größe D, bestimmt das Maß der Abweichung von F,(x) von F(2). Es sei 
& > 0 eine hinreichend kleine Zahl und z4 so gewählt, daß 


P{D,>z}=e 


ist. Wenn die Bedingungen der Aufgabe die Annahme gestatten, daß bei einem 
einzigen Versuch praktisch unmöglich ein Ereignis eintreten kann, dessen Wahr- 
scheinlichkeit gleich e ist, so gelangen wir zu dem folgenden Kriterium zur Nach- 
prüfung der uns interessierenden Hypothese. Im Resultat der n unabhängigen 
Versuche nimmt D, einen gewissen Wert an. Wenn es sich zeigt, daß D, >} 
ist, so bedeutet dies, daß bei einem einzigen Experiment (bei der Nachprüfung 
des Verhältnisses der empirischen Verteilungsfunktion zur Funktion F(x) bilden 
die n Versuche zur Bestimmung von Werten der Zufallsgröße nur ein Experi- 
ment) ein Ereignis mit der Wahrscheinlichkeit & eingetreten ist. Auf Grund 
unserer Annahme ist ein solches Ereignis praktisch unmöglich; wir müssen daher 
zu dem Schluß kommen, daß die erhaltenen Abweichungen wesentlich sind. In 
diesem Fall müssen wir die Hypothese zurückweisen, daß die uns interessierende 
Zufallsgröße die Verteilungsfunktion F(x) besitzt. Wird aber festgestellt, daß 
D„< 2% ist, so haben wir keinen Grund, die angenommene Hypothese fallen- 
zulassen; man muß sie zumindest so lange als übereinstimmend mit dem Ex- 
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periment anerkennen, wie eine befriedigende Übereinstimmung mit der Er- 
fahrung beobachtet wird. 

Die Sachlage ist hier die gleiche wie in jeder wissenschaftlichen Disziplin: 
Um einen theoretischen Standpunkt zu widerlegen, genügt es, wenigstens ein 
Gegenbeispiel anzugeben; um aber die Richtigkeit dieses Standpunktes zu be- 
weisen, dazu genügen Beispiele nicht. Solche befürwortenden Beispiele machen 
lediglich die Richtigkeit dieses Standpunktes wahrscheinlicher (den Ausdruck 
„wahrscheinlicher“ benutzen wir hier mehr im landläufigen Sinn als in der in 
diesem Buch angenommenen Bedeutung). 

Wir müssen noch eine Bemerkung machen. Wenn die Anzahl der Versuche 
groß ist, so setzen wir 

P{YnD,<z} Kid). 


Das auf dem Satz von A. N. KoLmoGorRorr beruhende Verträglichkeitskriterium 
läßt sich jetzt folgendermaßen beschreiben. D() bezeichne den tatsächlich 
gefundenen Maximalwert der Differenz |F,(x) — F(x)| und A, = Yn D®. Wenn 
die Differenz 

1—K(A) = P Yn Du > Au} 


klein ist, so ist ein wenig wahrscheinliches Ereignis eingetreten, und der Unter- 
schied zwischen F,(x) und F(x) muß als wesentlich angesehen werden; er läßt 
sich nicht durch die Zufälligkeit der beobachteten Werte erklären. Ist aber 
die Differenz 1 — K(},) groß, so muß man den Unterschied zwischen F,„(z) und 
F(x) für unwesentlich halten und unsere Hypothese als mit dem Experiment 
verträglich anerkennen. 


$ 63. Über die Nachprüfung der Unveränderlichkeit 
der Wahrscheinlichkeitsverteilungen 


Eine der wesentlichsten Aufgaben in der mathematischen Statistik ist die 
Lösung der Frage: Kann man auf Grund zweier Serien von unabhängigen Mes- 
sungen 

Ep ge. I (1) 
und 

Yo Ya. + Um (2) 
mit hinreichender Sicherheit behaupten, daß beide durch Beobachtungen an 
Zufallsgrößen gewonnen wurden, die die gleiche Verteilungsfunktion besitzen ? 
Auf diese Aufgabe stößt man bei der Lösung vieler praktisch und theoretisch 
wichtigen Aufgaben. Zur Illustration bringen wir zwei Beispiele dieser Art. 

Wir betrachten den Produktionsprozeß in einem Betrieb. Um die Homo- 
genität der Qualität der Gegenstände verschiedener Sendungen (aber auch 
innerhalb von großen Sendungen) festzustellen, wird jeder Sendung eine zu- 
fällige Auswahl entnommen und bei jedem der herausgenommenen Gegenstände 
ein bestimmtes Kennzeichen gemessen. Für die eine Sendung seien die Meß- 
ergebnisse durch die Zahlen (1) gegeben, für eine andere durch die Zahlen (2). 
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Kann man den Unterschied dieser beiden Systeme von Zahlen durch unver- 
meidbare zufällige Größenschwankungen erklären oder ist dieser Unterschied 
schon so groß, daß man von einem Unterschied in der Qualität der Gegenstände 
der betrachteten Sendungen sprechen muß? 

Bei der Durchführung eines physikalischen Experiments ist es wichtig fest- 
zustellen, ob sich während des Experiments die Bedingungen nicht geändert 
haben, unter denen es ausgeführt wird. Es ist besonders wesentlich, diese Kon- 
stanz der Bedingungen für solche Experimente zu klären, zu deren Durchführung 
eine längere Zeit benötigt wird oder bei denen während des Experiments einige 
Teile des Meßgeräts ausgewechselt wurden. So erhebt sich die Frage: Kann 
man auf Grund der Messungen (1) am Anfang des Experiments und der Mes- 
sungen (2) bei irgendeiner weiteren Etappe behaupten, daß sich die Versuchs- 
bedingungen nicht wesentlich geändert haben? Natürlich ist es in vielen prak- 
tisch wichtigen Aufgaben von größtem Interesse festzustellen, ob die Versuchs- 
daten wesentlich von der Hypothese der Invarianz der Verteilung abweichen. 
Einem solchen Problem begegnet man z.B. bei dem Vergleich der Qualitäten 
verschiedener Samensorten bezüglich ihrer Ertragsfähigkeit, ihrer Frühreife 
oder Beständigkeit gegenüber den einen oder anderen Erkrankungen. 

Es ist jedoch klar, daß die beiden soeben formulierten Aufgaben nur der Form 
nach verschieden sind und daß die Lösung der einen die Lösung der anderen 
nach sich zieht. 

Beide Versuchsserien (1) und (2) mögen, ebenso wie die einzelnen Glieder der 
Serien, voneinander unabhängig sein. Wir nehmen an, daß sie die gleiche stetige 
Verteilungsfunktion F(x) besitzen. Dies ist die statistische Hypothese, die nun 
nachgeprüft werden muß. Wir bezeichnen mit S„(x) und T,,(2) die empirischen 
Verteilungsfunktionen der ersten und der zweiten Beobachtungsserie und setzen 

Dan = sup [Sn(2) — Tr@)] , 


—m<7<o 


Daun = sup |Sm() —— T,(@)] . 
—n<e<o 


N. W. Smrnow hat gezeigt, daß unter der ausgesprochenen Voraussetzung bei 


Gültigkeit der Bedingung lim - = (0 <r<oo)!) die folgenden Limes- 
beziehungen bestehen: ge 


lim P VE Din< ı 1er? fürz>0; @) 
lim P|Y »s Dun<i= Ka= EC 1Re-2##fürz>0. (4) 
no L + n k=—oo 


Diese Sätze werden ganz nach dem Vorbild vom Ende des vorigen Paragraphen 
zur Nachprüfung der Hypothese über die Invarianz der Verteilungsfunktion 
angewandt. 


1) Diese Bedingung ist unwesentlich, und man kann sich von ihr befreien. 
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In dem Spezialfall m = n kann man außer den angegebenen Grenzresultaten 
von N. W. SmirRnow sogar die genauen Verteilungen der Größen D}, und D,„ 
angeben. Zur Abkürzung führen wir die folgenden Bezeichnungen ein: 


Di=D},, D= Da, ©=Izf2n]. 
Satz. Unter den oben ausgesprochenen gelten die Gleichungen 
DH) = Ö,(z) =0 für z< — 


0:0 = P|/3 Di<2]- 


Rn O Pr | n 
9:0=Pl/3 D.<: we — (6) 


0) 


Be) = d,d)=1 für z> > . 
Beweis. Wir ordnen die Resultate der beiden Beobachtungsserien (1) und (2) 
ihrer Größe nach, 3, <2<...<2,„, und betrachten eine Folge von Hilfs- 


zufallsgrößen &, Ey = = - » Egns die nach der folgenden Regel definiert werden: 
P ++ 1, wenn z, zur ersten Beobachtungsserie gehört, 
rn -*, 1, wenn z, zur zweiten Beobachtungsserie gehört. 
Setzen wir 
S=0, Seht t'+&: 
so finden wir die Beziehungen 
nD}= sup 5, nD,= sup |S,|. 
0<k<2n 0<k<2n 
Wir zeichnen in der (f, x)-Ebene die Punkte (k, $;) für k= 0,1,...,2n und 
verbinden diese Punkte durch Geradenstücke. Die so erhaltene Kurve wächst in 
n Punkten jeweils um 1 und fällt in n Punkten jeweils um 1. Unsere Linie (wir 
wollen sie eine Trajektorie nennen) beginnt also im Punkte (0, 0) und endet im 
Punkte (2 n, 0). Die Anzahl der möglichen verschiedenen Trajektorien ist gleich 
C},„, denn die Kurve wächst und fällt n-mal. Da nach Annahme alle Beobach- 
tungen ein und dieselbe Verteilungsfunktion besitzen, sind alle Trajektorien 
BERIHEREIDEEN, Die Wahrscheinlichkeit jeder Trajektorie ist demnach 


gleich = Die von uns gesuchten Wahrscheinlichkeiten 
1. {nD#<c} und 2. P{fnD.<c} 
sind in unserer geometrischen Interpretation die Wahrscheinlichkeiten dafür, daß 


1. sich die Trajektorie in ihrer ganzen Länge unterhalb der Geraden = c 
befindet, 


2. die Trajektorie in ihrer ganzen Länge zwischen den Geraden z=c und 
x = — c bleibt. 
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Wir beschränken uns weiterhin auf ganzzahlige Werte des Parameters c, 
da die Größen n Df und n D, nur ganzzahlige Werte annehmen können. 

Die Anzahl der für das Ereignis nt D > c günstigen Trajektorien bestimmen 
wir folgendermaßen: Jeder Trajektorie, die die Gerade x = c erreicht, ordnen wir 
eine neue Linie nach der folgenden Regel zu: Vom Punkt (0, 0) bis zu dem 
Punkt, wo die Trajektorie die Gerade <= c zum erstenmal berührt, falle die 
neue Linie mit der Trajektorie zusammen. Von diesem Punkt ab sei die neue 
Linie das Spiegelbild des zweiten Teils der Trajektorie bezüglich der Geraden 
x=c. Die neue Linie beginnt also im Punkt (0, 0) und endet im Punkt (2 n, 
2c). Man sieht leicht, daß die Gesamtzahl der neuen Linien (und damit die 
Anzahl der Trajektorien, die die Gerade = c erreichen) gleich C37* ist. Die 
neue Linie erfährt nämlich rn + c-mal eine Aufwärts- und n — c-mal eine Ab- 
wärtsbewegung. Die Anzahl der Trajektorien, die nicht die Gerade ze =c er- 
reichen, ist somit gleich C3„ — C}z°. Damit ist offensichtlich die Gleichung 
(5) bewiesen. 

Der Beweis der Gleichung (6) erfordert einige kompliziertere Überlegungen. 
Wir zerlegen die Menge M aller möglichen Trajektorien in disjunkte Teilmengen: 
X, enthält die Trajektorien, die weder die Gerade x = c (die Gerade «), noch 
die Gerade x = — t (die Gerade ß) erreichen, X, die Trajektorien, die « erreichen 
oder schneiden, aber nicht an ß herankommen; 3, die Trajektorien, die ß er- 
reichen oder schneiden, aber nicht & erreichen; 9, die Trajektorien, die erst & 
und danach ß erreichen und später nicht mehr an « herankommen; B, die 
Trajektorien, die zuerst 8 und danach « erreichen, aber nicht mehr an $ heran- 
kommen; X, die Trajektorien, die erst «, dann ß, später wieder &, aber dann 
nicht noch einmal ß erreichen usw. Offenbar sind von einer gewissen Stelle an 
alle so gebildeten Mengen von Trajektorien leer. Außerdem ist offensichtlich 


N-UWHL{UHBI. 


Zugleich mit den soeben definierten disjunkten Mengen bilden wir noch 
die folgenden Teilmengen von Trajektorien: A, — die Menge der Trajektorien, 
die & wenigstens einmal erreichen; B, — die Menge der Trajektorien, die 8 
wenigstens einmal erreichen; A, — die Menge der Trajektorien, die wenigstens 
einmal und danach f erreichen; B, — enthält alle Trajektorien, die wenigstens 
einmal 8 und danach «& erreichen; A, — enthält alle Trajektorien, die die 
Geraden & und 8 wenigstens einmal in der Reihenfolge a 8 « erreichen. Diesen 
Prozeß setzen wir bis zu seinem natürlichen Ende fort. Da nun die folgenden 
Gleichungen bestehen 


A=-UrZiUHR), B=B+zZ{U+B), 
A=-urZiUuHR), B=B+Z{U+ 8 
usw., so ist bei beliebigem i > 1 


[As;—ı — Asil + [Bas — Bail = Mi + Mai + Bai—ı + Bar- 
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Also wird 
= M— 2 [Az As) + [Bei — Bad} - 0) 


Zur Lösung unserer Aufgabe bleibt uns nun nur noch die Anzahl der Wege 
in jeder der Mengen As;_1; Ass; Bai_ı; B; (i=1,2,...) zu berechnen. Wir 
wollen diese Rechnung für die Mengen A, und A, durchführen. Jeder von 
(0, 0) ausgehenden Trajektorie, die die Gerade « erreicht, ordnen wir den Weg 
zu, der vom Punkt (0, 0) ausgeht und mit der ursprünglichen Trajektorie bis 
zum Erreichen der Geraden « zusammenfällt und danach das Spiegelbild dieser 
Trajektorie bezüglich der Geraden « ist. Dieser Weg endet im Punkt (2n,2c). 
Wir haben bereits ausgerechnet, daß die Anzahl dieser Wege gleich C}* ist. 
Wenn die Trajektorie erst die Gerade « und danach die Gerade f erreicht, so 
erreicht der soeben konstruierte Weg die Gerade x=3c. Um die Anzahl der 
Trajektorien der Menge A, zu berechnen, konstruieren wir folgendermaßen 
einen neuen Weg: Vom Punkt (0,0) bis zur Geraden « fällt er mit der ur- 
sprünglichen Trajektorie zusammen, weiter verläuft er als Spiegelbild der 
ersten Trajektorie bezüglich der Geraden « bis zur Erreichung der Geraden 
z=3c, die letzte Etappe ist schließlich die Spiegelung der ersten Spiegeiung 
an der Geraden @—=3c. Der neue Weg endet also im Punkte (2n,4c). Die 
Anzahl der neuen Wege (und damit die Anzahl der gesuchten Trajektorien) 
ist also — wie man leicht überlegt — gleich C37?°. Mit ähnlichen Über- 
legungen (indem man eine entsprechende Anzahl von Spiegelungen ausführt) 
findet man, daß die Anzahl der Trajektorien in jeder der Mengen A, und 
B; gleich C}z*® ist. Nach Gleichung (7) ist also die Anzahl der Trajektorien 
in der Menge W, gleich 

Gn— 22 (GP N). 
i=l 
Dies beweist die Gleichung (6). 

Die erste und die letzte Gleichung des Satzes sind evident. 

In dem betrachteten Spezialfall können wir jetzt die Grenzwertsätze (3) 
und (4) von N. W. Smrnow beweisen. Wir betrachten zu diesem Zweck das 
Verhältnis 
G* (nn? 


On (nr — ke)l(n + ke)! 
bei konstantem k. Mit Hilfe der Stieuınsschen Formel finden wir 


be ( 2 % = (1 +00). 


Benutzen wir weiter die Entwicklung des Logarithmus in eine TayLogsche 
Reihe und erinnern uns an die Gleichung c = [z 2 n] , so erhalten wir 


k? 0% 
log I, = = +01)— =2Kk:z2+0(l). 


IL,= 


Es ist also 
I, =e?#* (1 + o(1)) : (8) 
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Für k = 1 ergibt dies den Beweis der Gleichung (3). 
Zum Beweis der Beziehung (4) betrachten wir gewisse Zahlen z>0,ce>0 


und ein solches ganzes N, daß 
—2N?z’ ie 
€ = 16 


ist. Dabei ist dann auch 


| 
— 1)* en <z 


KI>N 
Wegen 
Case ES Ca. #+De 
ist 
f m—Ne 
| a I 1 
Iv<in<[®] Can C2n 


Folglich ist für genügend große n 


n—ke| 
Z yill<ieera+n)<z. 


<m<[®] 8 
Es wird also 
n—ke 
z mE Senewe|<z. 
v<w<[®] ME 
Da nach (8) für genügend große n 
u en—ke 8 
(— 1 ?#: Sr (1% an 22 
DES4 PA a 


ist, so erhalten wir für jedes z> 0 und bei beliebigem e > 0 für hinreichend 
große n die Ungleichung 


rs». = Ka) < € 


Dies war aber gerade zu beweisen. 

Zu den in diesem Paragraphen entwickelten Resultaten muß man noch eine 
Bemerkung machen: Die durch unsere Sätze empfohlene Regel zur Nach- 
prüfung der Invarianz der Verteilungsfunktion hängt nicht davon ab, wie 
diese Verteilungsfunktion aussieht. Für die praktischen Anwendungen ist dieser 
Umstand äußerst wichtig, da die wahre Verteilung der untersuchten Zufalls- 
größen in der Regel unbekannt ist und nur die Frage interessiert: Darf man 
annehmen, daß die unbekannte Verteilung ungeändert geblieben ist? Die 
einzige Forderung, die der Verteilungsfunktion bei der Ableitung der Sätze 
dieses Paragraphen auferlegt wurde, war ihre Stetigkeit. Diese Forderung 
braucht manchmal gar nicht nachgeprüft zu werden, da sie sich aus dem physi- 
kalischen Charakter der untersuchten Erscheinung ergibt. 
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$ 64. Der Begriff des kritischen Gebiets. Fehler erster und zweiter Art. 
Vergleich zweier statistischer Hypothesen 


In den vorhergehenden Paragraphen haben wir zwei Aufgaben behandelt, 
die mit der Nachprüfung statistischer Hypothesen zusammenhängen. Beide 
Resultate hingen nicht von der Verteilungsfunktion ab, der die untersuchten 
Zufallsgrößen unterworfen waren. Hier betrachten wir eine etwas andere 
Aufgabe. 

Wir wollen annehmen, daß uns der analytische Ausdruck der Verteilung 
einer Zufallsgröße & bekannt sei, daß jedoch die Werte der Parameter ©, 
©, ..., ©, unbekannt seien, von denen diese Funktion abhängt. Man kann 
zuweilen aus verschiedenen Gründen annehmen, daß die Parameter gewisse 
bestimmte Werte @, = 9%, &, = 9,..., 9, = ©% besitzen (einfache Hypo- 
these) oder einer gewissen Menge angehören (zusammengesetzte Hypothese). 
Es ist zu erforschen, ob die Beobachtungsergebnisse an der Zufallsgröße & 
diese Hypothese bestätigen oder nicht. 

Um die praktische Wichtigkeit der Aufgabe hervorzuheben, betrachten wir 
zwei Beispiele. 

Beispiel 1. Gegeben sei eine große Sendung von Gegenständen aus irgend- 
einem Betrieb. Jedes einzelne Produkt ist entweder einwandfrei oder fehler- 
haft. Man läßt die ganze Sendung abgehen, wenn die relative Häufigkeit p 
der fehlerhaften Produkte nicht groß, sagen wir, nicht größer als eine gewisse 
Zahl p,(0 <p, < 1) ist. Die Zahl p ist uns unbekannt; man muß sie durch 
Untersuchung einer (in bezug auf den Gesamtumfang der Sendung) verhält- 
nismäßig kleinen Anzahl von Produkten bestimmen. Wir betrachten die 
Zufallsgröße £, die gleich 0 ist, wenn sich das beliebig herausgegriffene Produkt 
als fehlerlos erweist, und gleich 1 ist, wenn es fehlerhaft ist. Die Verteilungs- 
funktion von £ ist gleich 

0 für <o0, 
Fe@)=11—pfür0o<z<i 
1 für >1. 


Der Parameter p, von dem die Verteilung abhängt, ist unbekannt. Unsere 
Aufgabe besteht darin, die Hypothese p < p, nachzuprüfen. 


Beispiel2. Eine Zufallsgröße sei normal verteilt, 


_@-a)! 


I, 


oy2r 
die Parameter a und o sind unbekannt. Es ist die Hypothese 


p@) = 


a—a]<a und o<o 


nachzuprüfen, wobei a, o, und & gewisse bekannte Zahlen sind. Diese und 
analoge Aufgaben ergeben sich in der Meßtechnik andauernd, ebenso auch in 
den Naturwissenschaften und in der Industrie. 
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Wir bezeichnen mit n die Anzahl der Beobachtungen, auf Grund derer man 
über die Richtigkeit oder Falschheit der angenommenen Hypothese urteilen 
muß. Es seien 

I 0, (1) 


die Resultate dieser Beobachtungen. Die Nachprüfung der Richtigkeit oder 
Falschheit einer Hypothese besteht in einem Verfahren, nach dem die Menge 
aller möglichen Resultate von n Beobachtungen in zwei disjunkte Teilmengen 
R,ı und R,s zerlegt wird. Wenn das System (1) von Meßresultaten zur Menge 
R,ı gehört, sehen wir dies als eine Bestätigung der nachzuprüfenden Hypo- 
these an, gehört es zur Menge R,,, so wird die Hypothese abgelehnt. Wenn 
wir die Zahlen (1) als Koordinaten des n-dimensionalen Raumes R, darstellen, 
so bedeutet offenbar jede Nachprüfung eine Zerlegung des Raumes R, in 
zwei Teile R,, und R,s. Liegt dabei der Punkt (z,...,x,) in der Teilmenge 
R,ı so wird die Hypothese angenommen, liegt aber (z,,...,2,) in der Teil- 
menge R,,, so wird die Hypothese fallen gelassen. Die Menge R,, nennt man 
das kritische Gebiet. Die Wahl des Nachprüfungsverfahrens ist daher der Wahl 
eines kritischen Gebietes äquivalent. 

Zur Veranschaulichung kehren wir zum Beispiel 1 zurück. Die Menge R, 
besteht in diesem Falle aus allen möglichen geordneten Systemen von n Zahlen, 
von denen jede nur die Werte 0 und 1 annehmen können. Das kritische Ge- 
biet R,, besteht aus den Elementen von R,, für die 


44 492m 
ist. 

Wir gehen nun zur folgenden speziellen Aufgabe der Nachprüfung von 
Hypothesen über, für die.es eine erschöpfende Lösung gibt: Gegeben seien 
zwei einfache Hypothesen HA, und H,. Die Hypothese H, sei durch die Glei- 
chungen 9, = 9; (i=1,2,...,k), die Hypothese H, durch die Gleichungen 
0 = 0; (i=1,2,...;k) definiert. Diese Hypothesen konkurrieren mitein- 
ander und auf Grund der ausgeführten Beobachtungen ist einer von ihnen der 
Vorzug zu geben. 

Wir bemerken, daß wir bei der Bestätigung oder Ablehnung der Hypothese H, 
zwei Arten von Fehlern begehen können. Einen Fehler der ersten Art begehen 
wir, wenn wir H, verneinen, während H, in Wirklichkeit richtig ist. Mit anderen 
Worten, ein Fehler der ersten Art tritt dann ein, wenn der Punkt (&,,...,%,) 
in das Gebiet R,, fällt, obwohl die Hypothese H, richtig ist. Einen Fehler 
der zweiten Art begehen wir, wenn wir H, als richtig annehmen, während 
diese Hypothese in Wirklichkeit falsch ist. Wenn das kritische Gebiet gewählt 
ist, kann man die Wahrscheinlichkeiten der Fehler der ersten und zweiten 
Art berechnen; wir bezeichnen sie bei vorgegebenem n und R,, mit den Buch- 
staben a, bzw. a,. 

Je kleiner bei vorgegebenem kritischem Gebiet die Zahlen «, und «a, sind, 
desto besser ist das kritische Gebiet gewählt. Jedoch kann man bei vorgegebener 
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Anzahl n der Versuche unmöglich bei noch so guter Wahl des kritischen Gebietes 
die Zahlen «, und a, gleichzeitig beliebig klein machen. Doch können wir durch 
eine Änderung des kritischen Gebietes stets erreichen, daß die Wahrschein- 
lichkeit eines Fehlers entweder der ersten oder der zweiten Art beliebig klein 
wird. Setzen wir z.B. Ry,a = R, so ist natürlich a, = 0; setzen wir aber 
R,ı = R„ so ist a, —=0. Hieraus ergibt sich folgendes Prinzip für die Wahl 
des kritischen Gebietes: Bei vorgegebenen Werten von a, und n muß man 
ein solches Gebiet wählen, für das «, minimal wird. Je kleiner wir dabei den 
Wert a, wählen, desto größer wird der Wert des Minimums von a, sein. All- 
gemein kann man nicht sagen, welches «, man wählen muß, um die Methode 
der Nachprüfung der Hypothese am erfolgreichsten zu gestalten, denn dabei 
spielen konkrete Umstände die Hauptrolle. 

Sei z.B. die Ablehnung oder die Annahme der Hypothese H, mit Material- 
aufwand verbunden. Wenn die Hypothese A, falsch ist, und sie wird trotzdem 
als richtig angenommen, so kann damit ein großer Aufwand verbunden sein 
(z.B. die Notwendigkeit der manuellen Herstellung einiger Einzelteile bei 
der Montage in irgendeinem Betrieb). Wenn gleichzeitig das Fallenlassen der 
Hypothese H, trotz ihrer Richtigkeit zu verhältnismäßig kleinen Verlusten 
führt, so ist es klar, daß man ein möglichst kleines «, wählen und sich dabei 
mit einem verhältnismäßig großen Wert «, zufrieden geben muß. 

Wir wollen nun annehmen, daß die praktischen Überlegungen in Betracht 
gezogen wurden und die Größe a, gewählt ist; dann gilt der folgende Satz 
von J. NEYMAN und E. PEARSoN, den wir nur für den Fall formulieren, daß die 
Größe £ eine endliche Verteilungsdichte sowohl bei der Hypothese H, als auch 
bei der Hypothese A, besitzt. 


Satz. Unter allen möglichen kritischen Gebieten, für die die Wahrscheinlich- 
keit der Fehler erster Art gleich a, ist, nimmt die Wahrscheinlichkeit der Fehler 
zweiter Art ihren kleinsten Wert für das kritische Gebiet R*, an, das aus allen 
Punkten (x,, % . - - , 2) besteht, für die 


IT fx, [H) > © IT f |) ©) 
k=1 k-1 


ist. Die Zahl c ist aus der Bedingung 


Yle) = Pfau u - u) C Ras/H,} =6 (3) 
zu bestimmen. 


Beweis. Im Falle unabhängiger Versuche ist die Wahrscheinlichkeit dafür, 
daß sich der Punkt (x, 7, ...,,) in irgendeinem Gebiet S befindet, gleich 


n 
P{SIH,} = S-: 2 % I [@./Rı) dr, dı,...da,, 
sofern die Hypothese H, richtig ist, und gleich 
P{SIE} = S.- ST I@IE) dx, dxy... day, 


1) R#, ist also das optimale kritische Gebiet. 
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wenn die Hypothese H, richtig ist. Daher können wir zu dem kritischen Gebiet 
R#,, für welches nach Voraussetzung 


P{R},/H,} = 6 
gilt, ein beliebiges anderes kritisches Gebiet R,, mit 

P{R,s/Hı} =60j 
zum Vergleich heranziehen. Nach dem Additionsaxiom der Wahrscheinlich- 
keiten ist 


P {Rus — Rys R%./H;} =P {Rus H,} —P {Rs Ry./H,} = P{R. R3,/H}} 
und 
P {R}r — Rys R3a/Hı} =4—P {R,a R%a/H,} . 


P {R,a Da Rya Rae/Hı} =P {Ri —— Rus R%,/H}} ’ 
Nach der Definition von R}, und auf Grund der letzten Gleichung ist 
P{R%, — Rıs Ry./H;} >cP {R%a —Ryu Rzs/Hı} =t P{R,s — Rz: RaalHı}- (4 
Für einen beliebigen, nicht zu R#, gehörigen Punkt gilt nach Definition von R}, 
Rn Rn 
Ri f@lH,) < A » 
und da sich das Gebiet R,, — R,z Ri, ganz außerhalb von Ry, befindet, muß 
CP{Rug— Rua Raa/Aı} > P {Ras — Rya Ren /He} 
sein. Diese Ungleichung führt zusammen mit (4) zu der Ungleichung 
P{Rüa— Ras RaslH3} > P{Rna—— Ru, Run / Hs} 


Fügen wir auf beiden Seiten der letzten Ungleichung P{R,, R%,/H,} hinzu, 
so finden wir 


d.h. 


P{R#IH,} > P{R,.jH;} . 
Da aber 
P{R,[A} =1 
und R}, = R„— Ri, Rag = R„— R,.ı ist, so wird 
P{R#,/H;} < P{R,../Hs} . 
Da P{R,,/H,} und P{R},/H,} die Wahrscheinlichkeiten der Fehler zweiter Art 
für die kritischen Gebiete R,, bzw. R#, darstellen, ist damit der Satz bewiesen. 
Es bleibt nun nur noch zu zeigen, daß die Wahl der Konstanten ce tatsächlich 
nach der Regel (3) vorgenommen werden kann. Dazu bemerken wir, daß die 
Funktion 
y(o) = P{RA,/H;} 
bei wachsendem c nur abnehmen kann (denn immer weniger Punkte (2), 2, ..., 
%,) werden der Ungleichung (2) genügen). Außerdem ist klar, daß y(0) = 1 ist 
(denn für jeden Punkt (2,, 2, . - . , %,) ist 


‚a f@,H) > 0). 
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Ferner folgt aus (2) 
P{Ras/H,} > cP{Ra/H;}. 


Ersetzen wir die linke Seite dieser Ungleichung durch Eins und erinnern uns 
an die Definition von y(c), so erhalten wir die Ungleichung 


1>cy(eo). 
Somit ist 


I<po<-. 


Für c — oo strebt also y(c) gegen 0. Da die Funktion y(c) nicht wächst, kann 
man zu jedem a, (0 < a, < 1) ein c finden mit der Eigenschaft 


-PE—-)<Sn<Sype+0). 


Ist im Punkt e die Funktion y(c) stetig, so ist die Wahl der Konstanten c nach 
der Regel (3) gerechtfertigt. Besitzt aber die Funktion y(c) im Punkt c eine 
Unstetigkeit, so wird die Lage komplizierter; die Definition der Menge R%, 
muß etwas abgeändert werden. Es muß die Menge der Punkte, für die 


IT f&,/H) = c IT f,/H,) 
k=1 k-1 


ist, aus R}, herausgenommen und zurMenge R}, hinzugefügt werden, so daß 
die Wahrscheinlichkeit eines Fehlers der ersten Art gleich «a, ist. 

Wir betrachten ein Beispiel. Es sei bekannt, daß & normal verteilt ist mit 
einer bekannten Dispersion 0°. Bezüglich der mathematischen Erwartung a 
gebe es zwei Hypothesen: a = a, (Hypothese H,) und a = a, (Hypothese A,). 
Gesucht ist das optimale kritische Gebiet. 

In unserem Beispiel läßt sich die Beziehung (2) folgendermaßen schreiben: 


_ı 5 aa] 


De =ı >, 


Wie man leicht nachrechnet, ist diese Ungleichung (unter der Voraussetzung 
Q, > a,) äquivalent mit 


Dm> Ri 2a+ a) 


k=ı 
oder — was dasselbe ist — mit 


ologe n 
=> eye ; + (a—-a)=h. 


Ir ı& ge 


Die so gewonnene Ungleichung bestimmt das optimale kritische Gebiet R};- 
Da die Größe 


ne N @—a) 


k=1 
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normal verteilt ist mit der mathematischen Erwartung 0 und der Dispersion 1, 
wenn nur die Hypothese H, richtig ist, so kann man mit Hilfe von Tabellen 
der Normalverteilung bei gegebenem a, leicht k, (und damit auch c) bestimmen. 
Es sei z. B. a, = 0,05 gesetzt. Dann ist k, = 1,645, und das optimale kritische 
Gebiet für &, = 0,05 ist durch die Ungleichung 


* 
E (u — a) > 1,645 on 
k=1 
bestimmt. 
Es ist interessant festzustellen, daß das kritische Gebiet in unserem Falle 
nicht von dem konkurrierenden Wert a, > a, abhängt. 
Das Gebiet R#, bestimmt sich aus der Ungleichung 


n o?log ec n 
Pius +5(@ +4), 


die sich offensichtlich auch so schreiben läßt: 


Zum <h- ana). 


co 


Die Größe auf der linken Seite dieser Ungleichung ist unter der Voraussetzung 
daß die Hypothese H, wahr ist, normal verteilt mit der mathematischen 
Erwartung 0 und der Dispersion 1. Hieraus folgt, daß die Wahrscheinlichkeit 
eines Fehlers zweiter Art gleich 

5 


h— (m 4) 


On m 0))= 45 j e 8 dz 


ist, 

Wenn die Größen a, und «, vorgegeben sind, ergibt sich die Aufgabe fest- 
zustellen, wieviele Versuche dazu ausreichen, daß fehlerhafte Schlüsse höchstens 
mit den Wahrscheinlichkeiten «, und &, gemacht werden. Die Minimalzahl 
dieser Versuche sei mit n = (a,, &,) bezeichnet. 

Mit wachsendem n wächst die Größe &,, = Ayla, n) nicht und strebt im 
allgemeinen gegen Null, Offenbar ist n(«,, &) das kleinste n, für das ,(0,, 2) < &g 
ist. 

In dem soeben betrachteten Beispiel läßt sich die Zahl n bei gegebenen 
Werten von a, und 0, sehr leicht finden. Da nämlich 

1— Ok) = a 
und 


® (1 r (a; — a) =0g 


ist, erhalten wir die zwei Gleichungen 


kh=yi-a) 
23 Gnedenko 
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und 

a Li a) = Ya) » 
y ist dabei die zu ®(x) inverse Funktion. Hieraus folgt 


n=— [pl —o)— ya)l. 


rn) 
Noch ein kleines Zahlenbeispiel: Es sei 


a, = 135, a, = 150, o = 25, 0, = 0,01, ©, = 0,03. 


Da 
(0,99) = 2,33, 9(0,03) = — 1,88 
ist, wird 
25° 25 
n= in [2,33 -- 1,88]? = 5 .4,212=49. 


Die minimale Anzahl der Versuche, die man notwendigerweise ausführen muß, 
um zwischen den Hypothesen H, und H, im Falle der Normalverteilung bei 
den angegebenen Daten eine Auswahl treffen zu können, muß also 49 sein. 
Nur bei dieser Anzahl der Versuche sind wir sicher, daß, wenn die Hypothese A, 
richtig ist, wir sie nur mit einer Wahrscheinlichkeit fallenlassen können, die 
nicht größer als ein Hundertstel ist; wenn die Hypothese H, richtig ist, so 
werden wir sie dann nur mit einer Wahrscheinlichkeit fallenlassen, die nicht 
größer als 0,03 ist. 


$ 65. Die klassische Methode zur Abschätzung der Parameter einer 
Wahrscheinliehkeitsverteilung 


Die klassische Methode zur Abschätzung der unbekannten Parameter in 
der Verteilungsfunktion einer Zufallsgröße £ besteht darin, daß die abzu- 
schätzenden Größen bis zur Beobachtung als Zufallsgrößen angesehen werden, ° 
die einem gewissen „apriorischen‘‘ Verteilungsgesetz unterworfen sind. Setzt 
man voraus, daß das apriorische Verteilungsgesetz bekannt sei, so kann man 
unter Benutzung des Bayzsschen Satzes das „aposteriorische‘ Verteilungsgesetz 
der Parameter berechnen unter der Bedingung, daß die Beobachtungsergeb- 
nisse an & gleich x,, 7, . . . , 2, Sind. 

Wir wir schon früher bemerkten, bezieht sich die ganze folgende Darstellung 
auf die Bestimmung der unbekannten Parameter a und a des Normalgesetzes 


(@—a) 
ı e 28, 


Pp(z/a, 0) = —— 
oV2r 
dem die zu beobachtende Zufallsgröße £ unterworfen ist. 

Die Verteilungsdichte der Wahrsckeinlichkeit dafür, daß als Resultat von 
n unabhängigen Beobachtungen an der Größe £ die Werte x,,... , 2, gewonnen 
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werden, unter der Bedingung, daß die unbekannten Parameter die Werte a 
und o haben, ist gleich 


|* 


e ? 


% 


1 
as ı +3 Kuld, oc) = —— 
fe 2 ja eo) (ey2z)* 
dabei ist 
= 3 (u —a)’ 
k=1 


gesetzt. 
Führen wir die Bezeichnungen 


ein, so lehrt eine einfache Rechnung, daß 
1 Mara) 
(o Var)” 
ist. Wir erinnern daran, daß in $58 folgende drei Aufgaben gestellt wurden: 
1. o sei bekannt, abzuschätzen ist a; 
2. a sei bekannt, abzuschätzen ist 0; 
3. a und o seien unbekannt, man schätze ihre Größen ab. 


0) 


fer. . », &ula, 0) = 


Setzt man voraus, daß o bekannt sei, und bezeichnet p,(a) die apriorische 
Verteilungsdichte der Größe a, so erhalten wir für die bedingte Verteilungs- 
dichte der Größe a bei vorgegebenem o und bei den gefundenen Werten z,,..., 
x, den Ausdruck 
a... fer 2a». - » Zn/a, 0) Pla) 

BT Eye nf a) la) de” 
Durch Einsetzen des Ausdruckes für f nach Formel (1) finden wir nach einigen 
evidenten Umrechnungen den Ausdruck 


_ nMa—a) 
20 _ 
Pılaltı, Zy --.,%;0) = en N. . (2) 
_ Ma—x) 
j e 2° .p,la) da 
In der zweiten und dritten Aufgabe lauten die entsprechenden Formeln 
Man & - - » » Zn/a, 0) Pa(0) 


a SEN IS ee rer 


und 
= My %g - - » ; Zu/a, 0) Pla, 0) 
Dalaran.) 9ula, ) dad” 
dabei bezeichnen die Funktionen 9,(0) und 9,(a, 0) die apriorischen Verteilungs- 
dichten der Größe o bzw. des Paares (a, o). 


23* 
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Setzen wir in diese Formeln den Ausdruck von / nach (1) ein, so finden wir 


nach leichten Umrechnungen die Ausdrücke 
8’ 


Ne 20 
Ylo/tı, I, ...3 Ins a) = Di un Mi. HR (3) 


oo — 
Ben 20°’ ,(0) do 


und 


55 Y+a—29 
94a, Ok Ep...) = — = 9 (a, 0) s (4) 
© — 57 (8 + (a — 2)") 
[fa te 2 Y,(a, 0) da do 
0 

Die so gewonnenen Formeln sind für die praktische Benutzung ungeeignet, 
nicht nur wegen ihrer Kompliziertheit, sondern hauptsächlich, weil die in sie 
eingehenden apriorischen Wahrscheinlichkeiten in der Regel unbekannt sind. 
Häufig macht man, wenn man die apriorischen Dichten nicht kennt, mehr oder 
weniger willkürliche Annahmen über sie und erhält so für die praktische Anwen- 
dung übersichtliche Formeln. Wir gehen auf einem anderen Wege vor: Wir 
machen ganz allgemeine Annahmen über den Charakter der apriorischen Ver- 
teilungen und leiten aus diesen Annahmen Grenzgesetzmäßigkeiten (für a —oo) 
für die aposteriorischen Wahrscheinlichkeiten ab. 

Satz 1. Wenn die apriorische Verteilungsdichte @,(a) eine beschränkte erste 
Ableitung besitzt und 

ya) +0 

ist, so ist gleichmäßig bezüglich « 


ei 


Yılalıı Ip 250) = e% k + (7) (+ |, (5) 


2n Yr 
wo “= 2 (a— 2) (6) 


3 


gesetzt ist und yılalty,Iy...,2%,;0) die aposteriorische Verteilungsdichle der 
Größe « bezeichnet. 
Beweis, Aus (6) finden wir die Beziehung 


= Ac 
a=r+—. 1: 
+ Im (7) 
Es ist also?) as 
e ® Pı ( + =) 
Ka Pr 


PılalRı Ip - - -, 70) = ® - 
Yr e !mlz+ arte da 
Yn 


= Wir bemerken, daß die Verteilungsdichte der Größe & gleich 


o 
Plz ip +. 250) = — Play, Las » » - > Zn 0) 
ist. Yr 
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Nach dem Mittelwertsatz ist 
Pı (@ + =) = Pl) + rm pl), 
wobei z=2+ 9° und0< © < List. 
Yn 
Nach Voraussetzung ist 
Mdi<c<+m@, 
daher erhalten wir jetzt die Gleichung 


a: 


_ %0 ’ 
arte] 
Yerlpıl®) + ra] 


a. 
co er WEN, 
ne [ei 2 pılz) da. 


Man überlegt leicht, daß 


o 


Um 


Yılalz,, Ve. Ins 0) = 


mit 


I, Beh (8) 


ist. Leichte Umformungen führen uns auf die Gleichung 


1 = & Filz) — re In 
ya) ern | 
Diese Gleichung zusammen mit (8) beweist unseren Satz. 
Satz 2. Unter den Bedingungen des vorigen Satzes ist 
M(alz,, 2 ...,;0)=& + o(2), 
R " s (6) 
MI[(a — z)2/x, Igor 9 Ku o] = | -+ 2] 
N Yn " 
Beweis. Aus (7) finden wir nämlich die Ausdrücke 
M(a/B) =& + -7_M(a/B) 
N 


m 
Ml(a —2)/B] = © M(2]B); 
B bezeichnet dabei irgendein Ereignis. Folglich gilt 
M(alz,, 2 - . . » 215 0) -3+ 2 [uns 393.0) de 
Yr 


und 


und 
Mia — el... = j 2 ylaltıı =.» 25 0) do. 


Setzt man hier den Ausdruck für die Funktion y, nach Formel (5) ein, so 
findet man nach einigen einfachen Rechnungen die behaupteten Formeln. 
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Dieser Satz gestattet es, die folgende Näherungsgleichung zu schreiben 


am:, 
der mittlere quadratische Fehler dieser Gleichung ist ungefähr — 


zwischen bestimmten Grenzen liegt unter der Bedingung, daß die Größen 
Ofyr.. i 


‚ %, bestimmte Werte angenommen haben. Es ist nämlich 


um, <z/® ir = P{la| < z/x,, 


ct 
und somit nach (5) 


rfje-4<3 Bde gefeten 


Vernachlässigt man die Größe O| — 


2 
ars 
Satz 1 gestattet die Bestimmung der Wahrscheinlichkeiten dafür, daß a 


(was man im allgemeinen nur dann 
n 

machen kann, wenn entweder co hinreichend klein oder n hinreichend groß ist), 

so folgt 


P la—2]<— za, 2 RP TEN mr 
Yn „ag ey Ag — . 


Satz 3. Wenn die apriorische Verteilungsdichte @,(o) eine beschränkte erste 
Ableitung besitzt und p,(s) #0 ist, so gilt gleichmäßig bezüglich z die Beziehung 


Yolzl, . “13, Ins a) Se k + 07 )a + DJE 


dabei bezeichnet , die aposteriorische Verteilungsdichte der Größe 
Yn, ®) 
m 
Beweis. Aus (9) finden wir zunächst 
o=8 ( + £) . 
und es ist 
Volzlaı Las». + > Ins 


Das de et u we Mas a) 


o—3 


B= 
und es its = —_ 
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Nach dem Mittelwertsatz ist 


- |, 28 28 , 
8 + —| = 948 — u 
( 7) 9.8) rate ) 
mitu=5+92:2und0<®<1. 
Yn 
Nach Voraussetzung ist 
WI <c<+o, 

daher erhält man die Gleichungen 


YelzXı, Bere) Ts a) 


BER 


—nlo 14 2) > = 7 I® 
e( Yr (14) ai Yr zn 
Yn 
a TS ee 
ua ai rm 
un 
de 2 n 
—n B\* 
(+2) Ber 
n 
Yn 
a n—3 n—3 IRB n—3 


2 3 [: 2 e"dkd=n ® 
0 
Nach der Stızrrinsschen Formel ist 


n—3 


rn, 


(10) 


(1) 
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folglich wird 


n—3 n n 8 
1-5) ERTL] 


n 3 
-5tT 


= vr (1 a e 


Die Gleichungen (10), (11) und (12) beweisen den Satz. 
Aus Satz 3 ergibt sich offenbar das folgende Resultat: 


+ ol =yrme *fli+oml. (19) 


Satz 4. Unter den Bedingungen des Satzes 3 gilt 
Mol, 2,...,3)=s+ o(-) 


und 


n 


Ml(o — 8)? 2 - - - » An; a] -2ı + ol 


Aus diesem Satz kann man schließen, daß für große n die Näherungsgleichung 


am V 1,3 (= — a)? 
ke 


besteht; ihr mittlerer quadratischer Fehler ist ungefähr Z— i 


Satz 3 läßt sich auch zur Bestimmung der Wahrscheinlichkeit benutzen, 
daß sich o innerhalb vorgegebener Grenzen befindet. Unter Vernachlässigung 
von Größen der Ordnung SE können wir behaupten, daß sich o bei vorge- 


gebenen Werten &,, .. . , 2%, und a mit der Wahrscheinlichkeit 


+2 
| et dt 
Ym 
ö 
innerhalb der Grenzen 


si1—— 31 + 
Z <o< Yr 
befindet. Bezüglich unserer dritten Aufgabe beschränken wir uns auf eine 


Formulierung der Resultate, da sich ihr Beweis in nichts vom Beweis des 
Satzes 3 unterscheidet. Wir führen die Bezeichnungen 


4=-—yn A=tyn 


& & 


N 


ein, wobei 4, =, V gesetzt ist. 
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Satz 5. Wenn die apriorische Verteilungsdichte $,(a, 0) beschränkte erste Ab- 
leitungen nach a und o besitzt und 9,&, 5) # 0 ist, so ist gleichmäßig bezüglich 
&, und ß} 

(a Bil )-— -alızol2)u4 |+1A0) 
» Kg. HT) = ——e Fr ; 
Yaldz, Pıltı> Ta ” ve Yr. 21 1 
dabei bezeichnet ı; die aposteriorische Verleilungsdichte des Paares (a,, ßı). 
Aus Satz 5 folgt: 


Satz 6. Unter den Bedingungen des Satzes 5 ist 


Malz Zu... + (4) 


Mila — a2, 2... al = ä|ı +0 5) : 


Mlo/z,, 24: :- &] = ai + o(=)l- 


Mio — 3)? a : 
[la — 31)?]%1, &gs - - » s &n = 1+0 vn . 
Wie die Sätze 1 und 3 läßt sich der Satz 5 zur Bestimmung der Wahrschein- 
lichkeit benutzen, daß sich a und o innerhalb vorgegebener Grenzen befinden 
unter der Bedingung, daß die beobachteten Werte gleich &,,.. . , 2, Sind. 
Die Sätze 1, 3 und 5 haben nicht alle die gleiche praktische Bedeutung. 
| Nach Satz 1 vergrößert sich die Genauigkeit der Näherungsformel (5) und (5) 
| nicht nur mit wachsendem n, sondern auch bei Verkleinerung von o. Bei be- 
| kanntem o wird man daher zur Bestimmung von a die Formeln (5) und (5°) 
| sogar für kleine n benutzen können, wenn nur o klein ist. Bei den Sätzen 3 
und 5 hingegen nahmen die Restglieder der gewonnenen Formeln nur mit 
| wachsendem n ab und sagen für kleine Werte von rn überhaupt nichts aus. 
Die soeben bewiesenen Sätze sind in gewissem Sinne Abwandlungen der 
folgenden elementaren Aussagen. Ist eine Zufallsgröße & normal verteilt, sind 
die Parameter a und o bekannt und sind z,,.... ,%, die Resultate unabhängiger 
Beobachtungen von £, so gilt: 


1. Die Verteilungsdichte der Größe 


r 


= sn (2 — a) 
ist gleich 


ae 
2 


Ylela, 0) = == e 


2. M(z/a,0o) = a und D(«ja, o) = - e 
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3. Die Verteilungsdichte der Größe 
8—0 — 
B=——— Y2n 


ist asymptotisch gleich ı_* 
= —— 2 
Yolz) a, 0) y 22 e . 


4. Mdla,0) = ol1 +0(.); D@1a.)=3,|1+0()]. 


5. Die Größen « und ß sind unabhängig, und die Verteilungsdichte des 
Vektors (a, 8) ist asymptotisch gleich 


BET, 
2 


yılz, yla, 0) = zue 
6. M@la,0)=a, Dea)=-%; 


MGla,o)=o, D(@la,o) »5—. 


Die Sätze 1 und 2 brauchen nicht bewiesen zu werden. 
Wir beweisen 3. In $24 fanden wir die Verteilungsdichte der Größes zu 


yy) Pre 


Man prüft leicht nach, daß die Verteilungsdichte von ß gleich 


(2 7 
mil.) = 0 (7= +0) 
ist. Durch einfache Umformungen kommt man für n — oo auf die Gleichung 
1 _ 
Yılzla, 0) = y?# € 


Zum Beweis von 4 bemerken wir, daß man durch elementare Rechnungen 
auf die Gleichungen 


rt) 1 rg+ı 
ya “. Ma—2 +) 


„ome o, Be = 0= 0? 
"3 ri) 
kommt. Hieraus gewinnt man die Beziehungen 
Fe 1 
Ms»so0 (1 ) 
und 
= o? 1 


Die Unabhängigkeit von & und 5 werden wir später beweisen. Die restlichen 
Behauptungen in 5 und 6 werden dann evident. 
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$ 66. Vertrauensgrenzen 


Die im vorigen Paragraphen dargestellte Methode zur Abschätzung unbe- 
kannter Parameter geht von der Annahme aus, daß der abzuschätzende Para- 
meter eine Zufallsgröße mit einer gewissen apriorischen Wahrscheinlichkeits- 
verteilung ist. In Wirklichkeit hat diese Annahme manchmal gar keinen Sinn, 
da einfach eine unbekannte Konstante abzuschätzen ist. Doch selbst in dem 
Falle, wo der Parameter wirklich eine Zufallsgröße darstellt, ist die Anwendung 
der genauen Formeln des vorigen Paragraphen schwierig, da die apriorische 
Verteilung dieser Größe unbekannt ist. 

Ein anderer Zugang zur Abschätzung unbekannter Parameter wurde von 
dem englischen Mathematiker R. A. Fisher vorgeschlagen. Seine Ideen wur- 
den in den Arbeiten des bekannten Statistikers J. NeymAn weiterentwickelt 
und erhielten so eine andere Gestalt. 

In der klassischen Aufgabenstellung ist gefordert, gewisse feste Grenzen so 
anzugeben, daß die Wahrscheinlichkeit dafür, daß sich der unbekannte Para- 
meter zwischen ihnen befindet, gleich einer genügend großen Zahl» (oder 
doch nicht kleiner) ist. In der neuen Aufgabenstellung sind solche Funktionen 
©’ und ©" der Beobachtungsergebnisse 

Ola En) > IE.) 
(diese Funktionen sind also Zufallsgrößen) aufzufinden, daß das Intervall 
[9’, ©] den Wert des Parameters @ mit einer Wahrscheinlichkeit nicht kleiner 
als w enthält. 

Die Funktionen @’ und ©’ heißen Verfrauensgrenzen. 

Wir veranschaulichen das Gesagte am Beispiel der Abschätzung der Para- 
meter der Normalverteilung. 

Bei der ersten der betrachteten Aufgaben setzen wir 


173 


d=5+1o, a = En, 
Yr Yr 
Wie auch immer die Werte der Parameter a und o sein mögen, wir haben offen- 
sichtlich 
Pfa <a<a”ja,o) = Pla #2 <3 < a5 FR 


er 


gleich 
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Insbesondere gilt also die Gleichung 
= . 7 
P|ja— Ee |- — Je iR 
a-21< =, 
ö 


Bei der zweiten Aufgabe sehen wir den Parameter a als bekannt an, während 
der Parameter o abzuschätzen ist. Wir setzen 


mit 


Man sieht leicht, daß 
Pie <o<u'iac} = PR <3< v|® o) 


ist. In $ 24 (y?-Verteilung) fanden wir die Verteilungsdichte p(y/a, 0) der Größe s 
unter der Bedingung, daß a und o vorgegeben sind. Es ist nämlich 
n-1_yn 
e(yla, 0) = Ver (>) e 2, 
ze 
2 


Hieraus finden wir 


vr R 
Pf <o<o”ja,0} = . / 
A 


an 


a9 


& 


u 1 

2 
2 2 r(}) 
2/; 


Wir sehen, daß die bedingte Wahrscheinlichkeit der Ungleichungen 
0’ < o< 0’ 


unter der Bedingung, daß die Parameter a und o bekannt sind, nicht von den 
Werten dieser Parameter abhängt. Folglich ist nach dem vorigen die Wahr- 
scheinlichkeit der en 


% -V.2 2 a-a<so<z]/2 z (a — a)? 
1 SeEuE_ DENE iz = 
Sr 


2’ 
#-1e 2dz. 


gleich 
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Wir gegen nun zur Betrachtung der letzten Aufgabe über, in der beide Para- 
meter a und o unbekannt sind. Wir setzen 


a=ätayns und 4=&+oyYns, 


,_Yna ra 
a Te Ms 
mit 


5 -Vi Sa Naar 


K=1 
Unter der Bedingung, daß a und o vorgegeben sind, ‚shall wir 


Pia <a<ajac}= Plu<® are 


er c.[a, 6 o) 


und 
Po, <o<oy/ao} = Pla, < a < la, 0). 


Wir müssen nun die bedingten Verteilungsdichten von * und ar auf- 


5 Yr 
finden unter der Bedingung, daß a und o bekannt sind. Es gilt 


i 15 Ma) _ 
UT Mi in 
al» 2 [x — a) — (@— a) Vz z (“ — =) 
wobi =, —-auıd! = — PH gesetzt ist (die Größen x; sind un- 


abhängig, normal verteilt und üben die mathematische Erwartung 0 und die 
Dispersion 0°). 
Wir führen nun im n-dimensionalen Raum (z,,...,2%,) ein neues ortho- 


gonales Koordinatensystem (Y,, .- ..9,) so ein, daß y, = Ynz’ ist. Dabei ist 
n 
== N=eN 
k=1 k=1 k=1 k=2 


und daher 
x —a Yı 
Hr n 3 YR 
k=2 
Es gilt 


wo die Größen a, den Beziehungen 
ie 1 füri=k, 
2 0 = | 
3 == 


0 fürizk 
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genügen und die Größen x; normal verteilt sind. Daher sind auch die Größen y, 
normal verteilt. Ferner ist My, =0 (k=1,2,...,n). Schließlich folgt aus 
Myyı = 5 Oz Ol Ma? = 0: B> O4; Gy -5 füri=k, 

j=1 je1 0 füri=k 
die Unabhängigkeit der Größen y,(k =1,2,...,n) und weiter die Beziehung 
Dy=#®(k—1,2,...,n 
Ferner ist 


rs TER 1 


1er] Zn Vaal-» 2.) mn | 


und in diesem Bruch sind Zähler und Nenner unabhängig; die Verteilungs- 
dichte des Zählers ist gleich 


= 
Yr—1 Fiat Tale 
oy2r 
und die Verteilungsdichte des Nenners (nach $ 24, y°-Verteilung) gleich 


VeR—n (van? nn 
ecI (>) ° y? 
2 
Daher ist nach $ 24 (Srunpentsche Verteilung) die Verteilungsdichte des Quo- 


n 
tienten 9, ) 2, Y2 gleich 
u 
— (1 + x?) 2, 
n—1l 
Frl) 
” 
Die Verteilungsdichte der Größe | Yr E yjist, wie man sich leicht überzeugt, 
E=2 


gleich 
y(z/a, 0) = nn (i+n 2)? ; 


© < c,la, ln [arte 


folglich ist 


Plu<2Z => 


n—1 
r( = 
Diese Wahrscheinlichkeit hängt nicht von den Werten der Parameter a und o 


ab. Wir können daher sagen, daß in der dritten Aufgabe die Wahrscheinlich- 
keit der Ungleichungen 


asıln <a—z<as/n 
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gleich 
& 
n “ 
Fri) 


w (i+n 2) ? dx 


ist. 

Wir müssen nun noch die Wahrscheinlichkeit der Ungleichungen finden, 
die die Grenzen für o festlegen. Wenn wir die bereits ausgeführten Umfor- 
mungen benutzen, so finden wir den Ausdruck 


Pf <o<ojao} = Pf =< alr < t,Ja, e) 


” 
— Plaa< PN <hola,o): 
k=2 


Hieraus gewinnen wir auf Grund der Resultate von $24 (y°-Verteilung) die 
Beziehung 


Y nn ——n—2 _Mn-0) 
Plz ERZI_ f et) ze dy 


er 


Auch diese Wahrscheinlichkeit hängt nicht von den Werten der Parameter a 
und o ab. Folglich besitzen die Ungleichungen 
rs < Yrsı 
—— Io << -— 
&ı ig 
die Wahrscheinlichkeit 
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AUS DEN ANFÄNGEN DER GESCHICHTE DER 
WAHRSCHEINLICHKEITSRECHNUNG 


(Kurzer Abriß) 


In der Einleitung sowie in den einzelnen Kapiteln dieses Buches machten 
wir bereits einige kurze historische Bemerkungen. Jetzt wollen wir, ohne auf 
Vollständigkeit Anspruch zu erheben, einen ganz gedrängten, aber zusammen- 
hängenden Abriß der Entwicklung der Wahrscheinlichkeitsrechnung geben. 
Die Wahrscheinlichkeitsrechung untersucht, wie jede eigentliche wissenschaft- 
liche Disziplin, die Gesetzmäßigkeiten der realen Welt. Hieraus wird klar, daß 
die Grundbegriffe der Wahrscheinlichkeitsrechnung sowie die Ausgangsvoraus- 
setzungen bei der Entwicklung der einen oder anderen Teile der Theorie nicht 
aus dem Kopf der Gelehrten stammen, sondern das Ergebnis eines kompli- 
zierten Prozesses der Abstraktion von den Erscheinungen der äußeren Welt 
darstellen. Obwohl sich bei der Entstehung der Wahrscheinlichkeitsrechnung 
ihr Anwendungsgebiet auf Glücksspiele beschränkte, muß man bedenken, daß 
die größten Gelehrten dieser Zeit — Huygrns, PascarL, FERMAT, J. BER- 
NOULLI — in ihr ein Mittel zur Erforschung der „Zufallserscheinungen“ sahen. 
Die Entdeckung klarer Gesetzmäßigkeiten, die beim Vorhandensein einer 
großen Anzahl von individuellen Einflüssen auftreten, welche nicht oder fast 
nicht miteinander zusammenhängen, wurde als die grundlegende naturphilo- 
sophische Rolle der Wahrscheinlichkeitsrechnung vorhergesehen. In diesem 
Zusammenhang ist es ganz interessant, einmal Huyazns eigene Worte aus 
seinem Buch „Über Berechnungen an Glücksspielen“ zu zitieren: „Auf jeden 
Fall halte ich dafür, daß der Leser bei einem aufmerksamen Studium des 
Gegenstandes bemerkt, daß es hier nicht nur um Spiele geht, sondern daß 
hier die Grundlagen einer sehr interessanten und ergiebigen Theorie entwickelt 
werden.‘ 

In der Folge wurde die Entwicklung der Wahrscheinlichkeitsrechnung in 
erster Linie durch Probleme der Naturwissenschaft und nicht durch logische 
Spekulationen der Vertreter des Idealismus gelenkt. Die Theorie der Beob- 
achtungsfehler und die Ballistik, Probleme der Astronomie und der Physik 
leiteten LAPLAaoe, Poısson, C.F.Gauss, LoBArscHzwskı und viele andere 
beim Aufbau der Wahrscheinlichkeitsrechnung. Häufig auftretende Probleme 
der Naturwissenschaft leiteten P. E. Tscuegyschzw und A. A. Markow beim 
Aufbau der Theorie der Summierung unabhängiger Summanden und der Theorie 
der Markowschen Ketten. 

Gegenwärtig beobachtet man ein Aufblühen der Wahrscheinlichkeitsrechnung 
in vielen Ländern der Welt, und wieder waren es dringende Probleme der Natur- 
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wissenschaft, die die führenden Gelehrten zur Schaffung neuer Gebiete der 
Wissenschaft anregten. Probleme der Physik riefen die Theorie der zufälligen 
Prozesse ins Leben, Fragen der Naturwissenschaft ergaben die Notwendigkeit, 
die logischen Grundlagen der Wahrscheinlichkeitsrechnung zu überprüfen. 

Verschiedenartige Probleme der Praxis, in erster Linie Probleme der Ver- 
kehrstheorie, haben zum Entstehen der Informationstheorie geführt, die durch 
K. SHanson ein faszinierendes Aussehen und die Gestalt einer wissenschaft- 
lichen Disziplin erhalten hat. 

Die Anzahl der Arbeiten und die Vielfalt der in ihnen angeschnittenen 
Fragen ist in den letzten Jahrzehnten derart groß geworden, daß es schon nicht 
mehr möglich ist, in einer kurzen Übersicht eine, wenn auch nur kleine, ob- 
jektive Vorstellung von der Mannigfaltigkeit der wesentlichen Richtungen in 
der Entwicklung der Wahrscheinlichkeitsrechnung und ihrer Anwendungen zu 
vermitteln. Daher mußte ich mich hier darauf beschränken, nur wenig Worte 
über die Anfangsentwicklung der Wahrscheinlichkeitsrechnung zu verlieren 
in der Hoffnung, daß es in nicht zu ferner Zukunft gelingen wird, eine spezielle 
Arbeit über die Geschichte der Wahrscheinlichkeitsrechnung zu verfassen, 
in der auch die Aspekte ihrer modernen Entwicklung berührt werden müßten. 

Die Wahrscheinlichkeitsrechnung entstand in der Mitte des 17. Jh., die 
ersten vorbereitenden Schritte wurden jedoch schon sehr viel früher gemacht. 
So berechnete schon Carpano (1501—1576) in seinem Werk „De ludo aleae“, 
auf wieviele verschiedene Arten man aus der Gesamtzahl aller möglichen Fälle 
beim Wurf zweier oder dreier Würfel die eine oder andere Anzahl von Augen 
erhalten kann. Ähnliche Berechnungen, die jedoch nicht die Anzahl der gleich- 
möglichen Fälle angeben, machte bereits TAarrarı (1499—1557), noch früher 
beschäftigte sich Lvooa Pacororo (1445—1514) mit der später berühmt ge- 
wordenen Aufgabe über die Verteilung eines Kartenspiels; über diese Aufgabe 
werden wir unten sprechen. Wissenschaftlich weniger begründete Versuche 
zur Berechnung der, wie wir jetzt sagen würden, Wahrscheinlichkeit zufälliger 
Ereignisse unternahm man auch früher im Zusammenhang mit Glücksspielen 
sowie bei der Bestimmung der Lebensdauer, bei der Volkszählung und bei 
Problemen der Versicherung, lange vor den oben genannten Arbeiten der 
Italiener. Hierzu bemerken wir, daß selbst das Wort „Hasard‘ aus einer 
eigentümlichen Abschätzung des Erwartungsgrades des Auftretens der einen 
oder anderen Anzahl von Augen hervorging. Das arabische Wort „Asar“ be- 
deutet in der Übersetzung „schwierig“; mit diesem Wort bezeichnete man eine 
Kombination der Augen, die nur auf eine Weise möglich ist. So sind beim 
Wurf von drei Würfeln „schwierige‘‘ Fälle das Auftreten von insgesamt 3 oder 
18 Augen. Von der Benennung dieses einen für die Spieler sehr ungünstigen 
Falles ist der Name Hasard später auf alle Glücksspiele übergegangen. 

Das Interesse Pascars und FERMATs an den Aufgaben der Wahrscheinlich- 
keitsrechnung entstand im Zusammenhang mit Glückspielen. Der CHEVALIER 
DE Mer£, der ein leidenschaftlicher Spieler war, legte einmal Pascau (1623 
bis 1662) eine Aufgabe vor, mit der er sich lange herumgequält hatte und die 
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für ihn offensichtlich eine ‚praktische‘ Bedeutung hatte. Diese Aufgabe bestand 
in folgenden: Zwei Spieler verabreden sich, eine Reihe von Partien zu spielen. 
Gewinner soll derjenige sein, der als erster s Partien gewinnt. Das Spiel wird 
nun in dem Augenblick abgebrochen, wo einer der Spieler a(a<s), der andere 
b(b > s) Partien gewonnen hat. Wie ist der Einsatz unter die beiden Spieler 
zu teilen? 

Lveca PaccıoLo schlug lange vor dieser Zeit vor, den Einsatz proportional 
der Anzahl der bereits gewonnenen Partien zu teilen. Carpano macht den 
begründeten Einwand, daß auf diese Weise überhaupt nicht die Anzahl der 
Partien berücksichtigt wird, die jeder der Spieler noch gewinnen müßte. Wenn 
auch CAarpAano den Fehler richtig angab, so vermochte er jedoch nicht, eine 
richtige Lösung zu finden. 

Richtige Lösungen wurden, ausgehend von verschiedenen Überlegungen, von 
PascAL, FERMmar (1601-——1665) und Huvazns (1629—1695) angegeben. PascaL 
löste die ihm gestellte Aufgabe und teilte sie FERMAT in einem Brief vom 
29. Juli 1654 mit. Dieser gab PascAu seine Lösung an. Schließlich schlug im 
Jahre 1657 Hvysens in seinem Werk „De ratiociniis in ludo aleae‘“ eine 
Lösung vor, in der, wie in der Pascauschen Lösung, zum ersten Mal der Be- 
griff der mathematischen Erwartung auftritt. Alle Lösungen beruhen auf dem 
Prinzip der Teilung des Einsatzes proportional der Wahrscheinlichkeit, das 
ganze Spiel zu gewinnen. 

Die Methoden von PAscAu und FERMAT wollen wir an dem von ihnen be- 
trachteten Spezialfall s = 3 veranschaulichen. 

PascaL beginnt mit dem Fall, daß von drei erforderlichen Partien der erste 
Spieler (A) zwei Partien, der zweite (B) nur eine Partie gewonnen hat. Wenn 
die Spieler noch eine Partie spielen würden, so würde der Spieler A entweder 
das ganze Spiel gewinnen, oder im ungünstigen Fall wäre die Anzahl der von 
ihm gewonnenen Partien gleich der gewonnenen Partien des Spielers B. Im 
ersten dieser Fälle erhält der Spieler A den ganzen Einsatz, im zweiten kann 


er nur die Hälfte verlangen. A kann daher Z und B nur — des Einsatzes er- 


halten. In seiner Arbeit „Traite du triangle arithmetique‘“ gibt PascAu die 
allgemeine Lösung an. Zur Vereinfachung der Schreibweise setzen wirm = s—a, 
n = s— b; dann muß der Einsatz unter die Spieler A und Bim Verhältnis 
On4m-ı + Oatn-ı ++ Oman-ı 
Omtn-ıt Ohta-ı tr + Omen-ı 
aufgeteilt werden. 

FERMAT verfährt in demselben Spezialfall folgendermaßen: Zur Beendigung 
des Spieles sind nicht mehr als s— a +s—5b—1, d.h. in dem betrachteten 
Beispiel nicht mehr als zwei Partien erforderlich. Dabei können die folgenden 
vier verschiedenen gleichmöglichen Fälle eintreten: 


123 4 
ABAB 
AADBB 
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Berücksichtigt man die Resultate der früheren Partien, so gewinnt der 
Spieler A in 3 Fällen und der Spieler B nur in einem Fall. Hieraus schließt 


FERMAT, daß der Spieler A auf . des Einsatzes Anspruch erheben kann. 


Huygzns ging ungefähr von denselben Begründungen wie PascaL aus, 
nämlich: Wenn von u +» gleichwahrscheinlichen Fällen u Fälle einen Ge- 
winn &, v Fälle einen Gewinn f bedeuten, so wird der zu erwartende Gewinn 
durch die Zahl 

ua-+vß 
u+rv 
abgeschätzt. Man sieht leicht, daß hier in noch genauerer Form als bei Pascar. 
der Begriff der mathematischen Erwartung in die Betrachtung einbezogen wird. 

Später kehrte Pascau noch einige Male zu der Aufgabe der Aufteilung des 
Einsatzes, darunter auch auf mehrere Spieler, zurück. 

In dem angegebenen Buch von Hyuczns sind alle Aufgaben gesammelt, 
die seinerzeit gelöst waren, außerdem wurden einige neue Aufgaben gestellt 
und die Auffindung ihrer Lösungen angeregt. 

Eine wichtige Etappe in der Entwicklung der Wahrscheinlichkeitsrechnung 
ist mit dem Namen Jacog Berxovzuis (1654—1705) verbunden. Er gab die 
Lösung einiger Aufgaben von Huygzns an. Ferner bemerkte er, daß die An- 
zahl der Fälle, in denen beim Wurf von n Würfeln die Summe der Augen 
gleich m ist, gleich dem Koeffizienten von x” in der Entwicklung von 

‚„atz+2 +42 42) 
nach Potenzen von x ist. Damit war der Anfang für die Betrachtung von 
erzeugenden Funktionen gegeben. Jaco BERNoULLI hat auch das Problem 
über den Ruin eines Spielers formuliert und gelöst. Die von uns in Kapitel I 
betrachtete Differenzgleichung wurde im allgemeinen Falle von BERNOULLI 


aufgestellt; den Spezialfallp=g = + untersuchte bereits HUYGENS. 


Mit diesem speziellen Resultat hängt jedoch in der Geschichte der Wissen- 
schaft derName JaXoB BERNOULLIS nicht in erster Linie zusammen. Sein Haupt- 
beitrag zur Wissenschaft besteht im Beweis des Satzes, der jetzt seinen Namen 
trägt und als Ausgangspunkt vieler späterer Untersuchungen diente. Einige 
Autoren behaupten, daß eigentlich das Gesetz der großen Zahlen schon lange 
vor BERNOULLI ausgesprochen wurde, zum Beispiel finden sich bei CARDANO 
Betrachtungen über die Approximation empirischer Daten an gewisse Kon- 
stanten bei einer großen Anzahl von Beobachtungen. Übrigens sagt auch 
BERNOoULLI selbst in seiner „Ars Conjectandi‘ über die Tatsache, daß die 
Methode der Bestimmung der Wahrscheinlichkeit nach der relativen Häufig- 
keit „nicht neu und nicht ungewöhnlich“ sei, folgendes: „Jedem ist auch klar, 
daß es zur Beurteilung irgendeiner Erscheinung nicht ausreicht. eine oder zwei 
Beobachtungen zu machen, sondern es ist eine große Anzahl von Beobachtungen 
erforderlich. Aus diesem Grunde weiß selbst der beschränkteste Mensch aus 
einem natürlichen Instinkt heraus von selbst und ohne jegliche vorherige Be- 
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lehrung (was sehr erstaunlich ist), daß, je mehr Beobachtungen in Betracht 
gezogen werden, desto kleiner die Gefahr ist, das Ziel nicht zu erreichen.“ 
Wir wissen jedoch, daß von den empirisch festgestellten Tatsachen bis zur 
Formulierung der Gesetzmäßigkeiten und bis zu ihrem Beweis aus den Voraus- 
setzungen über die Struktur der zu beobachtenden Erscheinung ein langer 
und komplizierter Weg zurückgelegt werden muß. Das Verdienst BERNOULLIS 
besteht darin, daß er es als erster verstand, der beobachteten Tatsache der 
Annäherung der relativen Häufigkeit an die Wahrscheinlichkeit eine theoretische 
Erklärung zu geben. 

Später, aber auch gleichzeitig mit BerwouLLı bemerkten verschiedene 
Autoren, daß sich die Faktoren, die nicht mit dem Wesen des Prozesses als 
Ganzem zusammenhängen, sondern nur in einzelnen Realisierungen auftreten, 
bei der Betrachtung des Mittels aus einer großen Anzahl von Beobachtungen 
auslöschen. Dieser Umstand wurde als empirische Tatsache vermerkt, und in 
der Regel wurde noch nicht einmal der Versuch unternommen, eine theore- 
tische Erklärung dafür zu finden. Übrigens war dies für viele Autoren im Unter- 
schied zu BERNOULLI gar nicht erforderlich, da das Vorhandensein von Gesetz- 
mäßigkeiten sowohl in den Erscheinungen der Natur, wie auch in den gesell- 
schaftlichen Erscheinungen für sie nichts anderes als eine Offenbarung der 
göttlichen Ordnung war. So schrieb das Mitglied der Londoner Königl. Gesell- 
schaft, JoHN ARBUTHNOT, daß die in der Gesellschaft zu beobachtende zahlen- 
mäßige „Gleichheit von Männern und Frauen nicht das Ergebnis eines Zufalls, 
sondern der göttlichen Vorsehung ist, die auf ein gutes Ende hinarbeitet“. 
(„Ein Beweis für die göttliche Vorsehung, genommen aus der konstanten 
Gesetzmäßigkeit, die sich bei der Geburt der beiden Geschlechter beobachten 
läßt‘, Philosophical Transaction 27, 1710—1712). 

Ein anderes Mitglied der Londoner Königl. Gesellschaft, WILLIAM DERHAM 
(1657—1735), schrieb in seinem Buch „Physikotheologie oder der Beweis der 
Existenz und der Eigenschaften Gottes auf Grund seiner Erschaffung der 
Welt‘ (London 1713), daß die Knaben und Mädchen nicht in zufälligen Pro- 
portionen geboren werden, sondern so, daß stets ein kleiner Überfluß an 
Knaben vorhanden ist, durch den „das höchste Wesen die größeren Gefahren 
ausgleicht, denen die Männer ausgesetzt sind“. 

Der in der Geschichte der Völkerkunde bekannt gewordene deutsche Sta- 
tistiker des 18. Jh., Pastor SüssmeLcH, behauptete in seinem Buch „Die gött- 
liche Ordnung‘, daß „im Kleinen alles ohne jegliche Ordnung vor sich zu 
gehen scheint. Man muß erst eine Menge von einzelnen und kleinen Zufällen 
mehrere Jahre hindurch sammeln und viele Einzelheiten zusammenfassen, um 
auf diese Weise die verborgenen Regeln der göttlichen Ordnung ans Licht zu 
bringen“. 

Später wurden diese Standpunkte der Kritik von LarrLacs unterworfen; 
wir kommen darauf zurück, wenn wir über dessen Arbeiten sprechen. 

Den nächsten Erfolg nach Bervovuı erzielte der französische Mathematiker 
Moıvre (1667—1754), der den größten Teil seines Lebens in England ver- 
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brachte. Im Jahre 1718 erschien sein Werk ‚The Doctrine of Chances‘“, das 
drei Auflagen (1718, 1738, 1756) erlebte. In ihm ist eine systematische Dar- 
stellung und eine Weiterentwicklung der Methoden zur Lösung von Aufgaben 
enthalten, die im Zusammenhang mit den Glücksspielen auftraten. In einem 
anderen Werk von ihm (,„Miscellanea Analytica“), herausgegeben im Jahre 
1730, ist der Beweis der uns bekannten Sätze von MOoIVRE-LAPLACE für den 


Fallp= 15 ‚ sowie der Stıerınsschen Formel enthalten. 


In dem im Jahre 1740 herausgegebenen Buch „The Nature and Laws of 
Chance‘ von Smmpson (1710—1761) findet sich unter anderen Problemen eine 
Aufgabe, die für die Kontrolle der Produktion und der Feststellung der Aus- 
schußquote wichtig ist. Gegeben sei eine Anzahl n von Dingen verschiedener 
Sorten: n, Dinge der ersten Sorte, n, der zweiten, .... Es werden auf gut 
Glück m Dinge herausgegriffen. Gesucht ist die Wahrscheinlichkeit dafür, daß 
dabei m, Dinge der ersten Sorte, m, der zweiten usw. herausgegriffen werden. 

Mit einer Reihe von Aufgaben über Glücksspiele, mit theoretischen Problemen 
der Völkerkunde und der Versicherung beschäftigte sich das berühmte Mitglied 
der Petersburger Akademie der Wissenschaften LEONHARD Eurer (1710—1783). 

Besonders berühmt wurde eine Aufgabe von NIKOLAUS BERNOULLI (1687 bis 
1759), die unter dem Namen des „Petersburger Spiels“ in die Geschichte der 
Wissenschaft eingegangen ist, Seine Zeitgenossen — DAnsEL BERNOULLI, 
D’AÄLEMBERT, BUFFON, CONDORCET u.a. — später die Mathematiker des 19. 
und 20. Jh., kehrten noch viele Male zu dem Paradoxon des „Petersburger 
Spiels‘‘ zurück. 

Das Spiel besteht in folgendem. Peter wirft eine Münze so lange, bis der 
Kopf erscheint, danach wird das Spiel als beendet angesehen. Paul bezahlt 
Peter einen Rubel, wenn der Kopf beim ersten Wurf erscheint, zwei Rubel, 
wenn er erst beim zweiten Wurf erscheint, vier Rubel, wenn der Kopf beim 
dritten Wurf fällt. Allgemein, wenn der Kopf zum ersten Mal beim n-ten 
Wurf erscheint, so bezahlt Paul dem Peter 2?—-1 Rubel aus. Welche Summe 
muß Peter dem Paul vor Beginn des Spiels als Teilnahmegebühr zahlen, damit 
das Spiel gerecht ist? Ein Spiel heißt dabei gerecht, wenn die mathematische 
Erwartung des Gewinns gleich den Teilnahmekosten ist. 

Die mathematische Erwartung des Gewinns von Peter ist gleich 


al an —1_ 1 == 
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n=1 n=1l 
Damit das Spiel gerecht ist, müßte Peter dem Paul eine unendlich große Summe 
geben. Vom Standpunkt des gesunden Menschenverstandes aus ist dieses 
Resultat reiner Unsinn: Kein vernünftig denkender Mensch würde an so einem 
Spiel teilnehmen. 

Zur Lösung dieses Paradoxons wurden viele verschiedene Lösungen vorge- 

schlagen. Das Petersburger Akademiemitglied DAnıeL BERNoULLı (der Neffe 
von NIKOLAUS BERNOULLI) zog die sog. „moralische Erwartung‘ in Betracht. 
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Wir wollen nicht bei der Definition dieses Begriffes verweilen, da er keine 
wissenschaftliche Bedeutung erlangte, und, nebenbei gesagt, das Paradoxon 
des Petersburger Spiels nicht löst. Größere Aufmerksamkeit verdient eine von 
Poıssox ausgesprochene Überlegung. Der Gedanke der von ihm vorgeschla- 
genen Lösung besteht in folgendem: Es gibt keine natürlichen oder juristischen 
Personen, die ein unendliches Kapital besitzen. Wenn daher Paul verspricht, 
eine beliebig große Summe zu zahlen, wenn nur der Kopf lange nicht erscheinen 
wird, so nimmt er damit eine unerfüllbare Verpflichtung auf sich. Berücksichtigt 
man dies und formt die Bedingungen des Petersburger Spiels etwas um, so er- 
hält das Resultat schon eine vernünftigere Bedeutung. Diese Umformung läuft 
auf folgendes hinaus: Paul zahlt die Summe 2*—1 solange, wie diese Zahl sein 
Kapital nicht übersteigt, aber von dem n ab, bei dem 2*—1 sein Kapital über- 
trifft, zahlt er sein ganzes Kapital aus. Sei z.B. Pauls Kapital gleich 10000 
Rubel, dana ist 21° < 10000 < 2. Die erste Bedingung ist also für n < 15 
anwendbar, die zweite Bedingung von n=15 ab. Folglich ist die mathe- 
matische Erwartung von Peters Gewinn gleich 


14 1 ER © ı 

2a? + I, zu 10000 < 8,25. 
n—ı1 n=15 

Beträgt Pauls Kapital 1000000000, so ist Peters Einsatz, der ja gleich der 

mathematischen Erwartung seines Gewinns sein soll, trotzdem immer noch 

kleiner als 16 Rubel. Sogar in dem Fall, wo Pauls Kapital 10'% Rubel beträgt, 

ist die mathematische Erwartung von Peters Gewinn nicht größer als 26 Rubel. 

DanteL BernouLnı (1700—1782) — eines der ersten russischen Akademie- 
mitglieder — beschäftigte sich mit der Theorie der Beobachtungsfehler, er 
stellte als erster die Frage nach der Berechnung der Wahrscheinlichkeit von 
Hypothesen unter der Bedingung, daß die Beobachtung schon einige Ergebnisse 
gezeitigt habe. Diese Aufgabe fand erst im Jahre 1764 in einer Arbeit von 
Bayszs ihre Lösung. 

Bayzs (gestorben 1763) gewann neben den in unserem Buch angeführten 
Formeln noch eine Reihe von Formeln!), die verschiedene Aufgaben spezieller 
Natur lösen. Als Beispiel führen wir die Lösung der folgenden Frage an: Ein 
Ereignis A besitze die Wahrscheinlichkeit p, deren Wert unbekannt sei. Ge- 
sucht ist die Wahrscheinlichkeit dafür, daß p im Intervall von a bis 5 ein- 
geschlossen ist, wenn im Resultat von n unabhängigen Versuchen das Ereig- 
nis m mal eingetreten ist und n — m-mal nicht eingetreten ist und wenn außer- 
dem die Wahrscheinlichkeitsverteilung der Größe p vor den Versuchen im Inter- 
vall (0, 1) gleichmäßig ist. Eine leichte Rechnung führt uns zu der Gleichung 


das Ereignis A 
tritt m mal ein 


famll— ajn—m de 
Pla<p<» N = 


fu — zn mdz 
0 


1) „An Essay towards solving a Problem in the Doctrine of Chances“, Philosoph. Trans., 
1764, 1765. 
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Dieselbe Aufgabe interessierte später lebhaft den französischen Gelehrten 
Conposcer (1743—1794) — einen der führenden Köpfe der französischen 
bürgerlichen Revolution von 1789. Insbesondere interessierte ihn das Problem 
der Anwendung der Wahrscheinlichkeitsrechnung auf die Analyse der Fällung 
von Gerichtsurteilen durch Stimmenmehrheit. 

Eine Reihe interessanter Aufgaben, die den Begriff der Wahrscheinlichkeit 
verallgemeinert, wurde von dem französischen Naturforscher Burrox (1707 bis 
1788) betrachtet. In dem Aufsatz „Essai d’Arithmetique morale“, der im 
Jahre 1777 gedruckt wurde (nach Aussagen seiner Freunde jedoch bereits 
1760 geschrieben war), wurden geometrische Wahrscheinlichkeiten in die Be- 
trachtung einbezogen und viele ‘Aufgaben mit ihrer Hilfe gelöst. Insbesondere 
ist die Aufgabe über den Wurf einer Nadel zum ersten Mal in dieser Arbeit 
Burrons betrachtet worden. Burrox hat auch Experimente ausgeführt mit 
dem Ziel, das Gesetz der großen Zahlen an Beispielen einfachster Art nach- 
zuweisen (Wurf einer Münze usw.). Später sind solche Versuche mehrfach 
ausgeführt worden, insbesondere auch für die von uns im ersten Kapitel be- 
trachtete Burronsche Aufgabe. 


Tabelle 13 


Fels Anzahl der | Experimenteller 
Nadelwürfe Wert von x 


Experimentator 


3,1586 
3,1553 
3,1419 
3,1415929 


Hier einige Resultate, die, nebenbei gesagt, zur experimentellen Bestimmung 
der Zahl z benutzt wurden. 
Da in der Burronschen Aufgabe 


Be}: 
pP u 177 
ist, so ist ungefähr 
21n 
nu ——; 
am 


n bezeichnet dabei die Anzahl der Nadelwürfe, m die Anzahl der dabei beob- 
achteten Fälle, in denen die Nadel eine der Geraden schneidet. Wir bemerken, 
daß die Resultate von Fox und Lazzarımı wenig glaubwürdig sind. In dem 
Experiment von LAZZARINI wird der Wert von z bis auf sechs Stellen hinter 
dem Komma richtig gewonnen. Eine Änderung der Zahl m um Eins hat aber 
mindestens eine Änderung der vierten Stelle hinter den Komma zur Folge, 
wenn n nicht größer als 5000 ist, denn es ist (a > ]) 


am+l) em _ a „| 
2in ZIm — Din > am > 9001. 
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Es gibt also überhaupt nur einen Wert m, bei dem man den von LAZZARINI 
gefundenen Wert von x erhalten kann. Die Wahrscheinlichkeit aber dafür, 
daß die Nadel genau m mal die Geraden schneidet, ist nach dem lokalen Satz 
von Moıvz&-Larracz gleich 


_m_-np! 
P,(m) N Sn . 
y2 anpgq 
Es ist aber bei beliebigen m, n und p 
1 map! 1 


e znpq < . 
VYarnpg Tyennpgq 

Die Wahrscheinlichkeit dafür, daß man das Resultat von Lazzarını bekommt, 

ist also bei einer noch so günstigen Wahl des Verhältnisses 4 kleiner als ne ; 

Viele wertvolle Resultate veröffentlichte Burron über die Statistik der 
Bevölkerung von Paris und von ganz Frankreich. 

Die größten Fortschritte in der Wahrscheinlichkeitsrechnung sind mit dem 
Namen des bedeutenden französischen Mathematikers und Mechanikers PIEREN 
Laruacn (1749—1827) verbunden, der übrigens auch ein ausländisches Mit- 
glied der Russischen Akademie der Wissenschaften war. Die ersten Arbeiten 
von Larzaoe über die Wahrscheinlichkeitsrechnung wurden im Jahre 1774 
gedruckt; seit dieser Zeit gab er das Interesse an dieser Disziplin sein ganzes 
Leben lang nicht auf. In der Arbeit „Me&moire sur la probabilit& des causes 
par les evenements“ (M. A.S. P., Savantes etrangers, VI) beschäftigte er sich 
mit der klassischen Aufgabe über die Verteilung des Einsatzes, gab als erster 
eine klare Formulierung der Resultate von Bayzs an und beschäftigte sich 
mit der Bestimmung des Mittels aus einer großen Anzahl von Beobachtungen 
an ein und derselben Erscheinung. Wesentlicher ist der Umstand, daß in dieser 
Arbeit zum ersten Mal viele Gedanken ausgesprochen wurden, mit denen sich 
LarLaor bis an sein Lebensende beschäftigte. In den folgenden Arbeiten 
kehrte Larzaoz mehrmals zu der Aufgabe der approximativen Darstellung 
der Wahrscheinlichkeit von Ereignissen zurück, die von einer großen Anzahl 
von Ursachen abhängen. Der erste Versuch einer Lösung dieser Aufgabe wurde 
von ihm anscheinend in der Arbeit „Memoire sur les probabilites“ (M. A.S. P., 
1778—1781) veröffentlicht. Zur gleichen Zeit entwickelte er in seiner Arbeit 
„Memoire sur les suites“ (M. A. S. P., 1779—1782) die Theorie der erzeugenden 
Funktionen, die, wie wir bereits erwähnten, zum ersten Mal bei J. BERNOVLLI 
bei der Lösung einer speziellen Aufgabe erschien. Die Bevölkerungsstatistik, 
Aufgaben der Fehlerrechnung, die Anwendung der Wahrscheinlichkeitsrechnung 
auf astronomische Probleme — dies ist der Kreis der Probleme, die Larzacn 
interessierten. Wir wollen nicht bei der Analyse jeder dieser Arbeiten ver- 
weilen, da er selbst über seine Untersuchungen sowie die Forschungen der 
ganzen vorhergehenden Periode in seinem klassischen Werk ‚Theorie analytique 
des probalites‘ (1812, 1814, 1820, 1886) Bilanz zog. Als Einleitung zu diesem 
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Buch bringt Larzacz seine in der „Ecole Normale“ im Jahre 1795 gehaltenen 
Vorlesungen, die unter dem Namen „Essai philosophique sur les probabilites‘ 
bekannt sind. 

In seiner „Theorie analytique des probabilites‘‘ entwickelte LarLace als 
erster systematisch die Hauptsätze der Wahrscheinlichkeitsrechnung. Er gab 
eine genaue Definition der Wahrscheinlichkeit an, die wir heute die klassische 
nennen; er erbrachte den Beweis der Sätze, die später die Sätze von MoIvRE- 
LAPLAcE genannt wurden; er schuf die Fehlerrechnung und die Methode der 
kleinsten Quadrate und benutzte die grundlegenden theoretischen Resultate 
für die Zwecke der Bevölkerungsstatistik. Dabei beschränkte sich LarLAacE 
nicht auf die Gewinnung allgemeiner mathematischer Resultate, sondern 
betrachtete auch umfassende statistische Tabellen, die oft auf seine Anforderung 
hin angefertigt wurden. Dies alles war begleitet von der Betrachtung oder 
zumindest der Formulierung dem Inhalt nach interessanter oder der Form 
nach unerwarteter Beispiele. - So wies er darauf hin, daß die Anzahl der Briefe, 
die wegen fehlender Adresse von der französischen Post nicht zugestellt werden 
konnten, im Verlaufe einer Reihe von Jahren fast unverändert blieb. Wir 
besitzen nicht die statistischen Daten der französischen Post, daher wollen wir 
dieses Beispiel von LArLace an den Angaben der russischen vorrevolutionären 
Statistik illustrieren (Tabelle 14). 

Ein bedeutendes Interesse verdient die allgemeine philosophische Einstellung 
von LAPLAOE, die von ihm in seinem „Essai philosophique sur les probabilites“ 
klar ausgedrückt ist. Ich glaube nicht fehlzugehen, wenn ich diese Anschau- 
ungen mechanistisch-materialistisch nenne. An einigen Stellen führt er zweifel- 
los den Kampf mit theologischen und teleologischen Erklärungen der Natur- 
erscheinungen. In dem er auf die Versuche von LEIsnız zu sprechen kommt, 
durch mathematische Spekulationen die Existenz Gottes zu beweisen, be- 
merkt Larraor: „Ich erinnere hieran nur aus dem Grunde, um zu zeigen, in 
welchem Maße Vorurteile der Kindheit selbst die größten Leute irreführen 
können.“ An anderer Stelle sagt er, daß „das ständige Übergewicht der Ge- 
burten von Knaben über die Geburten von Mädchen sowohl in Paris wie auch in 


Tabelle 14 


Onaman 


der Briefe 
in Millionen ohne Angabe 


364 Aus den Anfängen der Geschichte der Wahrscheinlichkeitsrechnung 


London durch die ganze Beobachtungsperiode hindurch einigen Gelehrten 
als ein Eingriff der Vorsehung erschien ....‘“. Jedoch bemerkt er später, ist 
dies „ein neues Beispiel dafür, wie häufig endliche!) Ursachen mißbraucht 
werden, die stets bei einer tieferen Untersuchung der Fragen verschwinden ...“. 

Seine eigentliche Weltanschauung formuliert LarLacz folgendermaßen: 
»- .. Wir müssen den jetzigen Zustand des Weltalls als eine Folge des vorher- 


gehenden Zustandes und als Ursache für den folgenden ansehen. 


Ein Geist, dem zu einem vorgegebenen Zeitpunkt alle Kräfte bekannt 
wären, welche die Natur beleben, und der die relative Lage aller ihrer Bestand- 
teile kennen würde, der außerdem hinreichend groß ist, um diese Angaben 
einer Analyse unterziehen zu können, würde in einer einzigen Formel die Be- 
wegung der größten Körper des Weltalls zugleich mit den Bewegungen der 
kleinsten Atome zusammenfassen können: Es bliebe nichts, was für ihn zweifel- 
haft wäre, und sowohl in die Zukunft wie auch in die Vergangenheit hätte er 
einen vollständigen Einblick. Der menschliche Geist vermittelt uns in der 
Vollkommenheit, die er der Astronomie zu geben verstand, eine schwache Vor- 
stellung eines solchen allumfassenden Geistes“. ... „Es kommt der Tag, an 
dem dank der Forschung mehrerer Jahrhunderte Dinge, die uns heute noch 
verborgen sind, in ihrer ganzen Klarheit vor uns erscheinen; und unsere Nach- 
kommen werden sich wundern, daß so offensichtliche Wahrheiten uns ent- 
gangen sind.“ 

Wir erinnern noch an zwei große Gelehrte, die die Wahrscheinlichkeits- 
rechnung ein großes Stück vorwärts gebracht haben. Es handelt sich um 
Gauss (1777—1855) und Poısson (1781—1840). Während Gauss fast aus- 
schließlich im Zusammenhang mit der Ausarbeitung der Methode der kleinsten 
Quadrate genannt werden muß — nebenbei gesagt, ist diese gleichzeitig und 
unabhängig davon von Leeenpee (1752—1833) und Larzacz entwickelt 
worden —, ist der Name von Poissox mit der Verallgemeinerung des Gesetzes 
der großen Zahlen in der Form von BErnovLLı auf den Fall unabhängiger 
Versuche verknüpft, wobei die Wahrscheinlichkeit für das Eintreten eines 
Ereignisses von der Nummer des Versuches abhängt. Poısson erweiterte die 
Sätze von LArLACE-MoIvRe auf diesen Fall und gewann eine neue wichtige 
Verteilung — das Poıssonsche Gesetz. Poısson erhielt sein Verteilungsgesetz 
als erster auf demselben Wege, den wir im zweiten Kapitel einschlugen. Die 
Hauptresultate Poıssons sind in seinem großen Werk „Recherches sur la 
probabilit& des jugements, en matiere criminelle et en matiere civile‘‘ (1837) 
enthalten.?2) Die Anwendung dieser Resultate in der Ballistik schilderte er in 
der Arbeit „Me&moires sur la probabilite du tir ä la eible“. 

Wir verweilen noch bei einem berühmten Problem, das GAvss in einem Brief 
vom 30. Januar 1812 LarLAoz mitteilte. Dieses Problem fand im Verlaufe von 
über 100 Jahren keine Lösung, erst im Jahre 1928 gelang des dem sowjetischen 


1) Das ist die teleologische Erklärung der Erscheinungen. 
2) In dieser Arbeit wird zum ersten Mal der Begriff „Gesetz der großen Zahlen‘ eingeführt. 
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Mathematiker R. O. Kusmıx (1891— 1949), diese vollständige Lösung anzugeben. 
Die Aufgabe besteht in folgendem: Man bestimme die Wahrscheinlichkeit 
dafür, daß bei der Entwicklung einer aus dem Intervall (0,1) beliebig heraus- 
gegriffenen Zahl in einen gewöhnlichen Kettenbruch der n-te Nenner einen Rest 
zwischen O undx2 (0 <x<< 1) besitzt. Kvsmın gewann im Jahre 1928 für diese 
Wahrscheinlichkeit — sie sei mit P,(x) bezeichnet — die Gleichung 


Pu) = E42 + ol") 


(« konstant). Im Jahre 1948 konnte er zeigen, daß das Restglied dieser Formel 
sich in der Form O(&*) (0 <a <1 eine Konstante) schreiben und sich nicht 
besser abschätzen läßt. Wir können jedoch nicht an der Tatsache vorbeigehen, 
daß Larracr und Poısson, die einen großen Einfluß auf die Entwicklung der 
Wahrscheinlichkeitsrechnung nahmen, gleichzeitig die indirekte Ursache ihrer 
späteren Stagnation waren, die für Westeuropa in der zweiten Hälfte des 19. 
und in den ersten Jahrzehnten des 20. Jh. charakteristisch waren. Beide Wissen- 
schaftler empfahlen die Anwendung der Wahrscheinlichkeitsrechnung auf 
„moralische Wissenschaften“. LAPrLacz motivierte die Notwendigkeit solcher 
Anwendung damit, daß doch „der größte Teil unserer Urteile auf der Wahr- 
scheinlichkeit von Zeugenaussagen beruht und es daher sehr wichtig ist, diese 
zu berechnen“. Eine der wichtigsten Aufgaben der „moralischen Wissen- 
schaften‘ besteht nach Larrace in der Bestimmung der Wahrscheinlichkeit 
dafür, daß ‚ein Gerichtsurteil, das ja ein Mehrheitsbeschluß ist, richtig ist, d. h. 
der wahren Lösung des gestellten Problems entspricht“. 

Der Lösung ähnlicher Aufgaben wurde am Ende des 18. und im Anfang des 
19. Jh. eine große Anzahl von Arbeiten gewidmet. Eines der Hauptprinzipien, 
die zu ihrer Lösung angewendet wurden, war die Voraussetzung, daß die ein- 
zelnen Richter unabhängig voneinander urteilen und daß die Wahrscheinlich- 
keit, mit der sie zur richtigen Lösung eines Problems kommen, konstant ist. 
Nähmen an der Lösung eines Problems eine große Anzahl von Richtern teil, 
so würde das Gericht, das die Probleme durch einfache Stimmenmehrheit löst, 
nach dem Satz von BERNOULLI bei der Fällung eines Urteils praktisch keinen 
Fehler machen. Wie S. N. BErNnstEın (Wahrscheinlichkeitsrechnung, S. 192, 
4. Aufl.) bemerkt, „ist diese Behauptung offensichtlich falsch, denn hier wird 
nicht beachtet, daß alle Richter auf der Grundlage derselben Indizienbeweise 
und Zeugenaussagen urteilen, so daß sie sich mehr oder weniger an dem gleichen 
Material informieren, und wenn die verwickelten Umstände den einen in die Irre 
führen, so ist auch für die anderen Richter ein Fehlurteil sehr wahrscheinlich, 
anders ausgedrückt, bei einem Gerichtsurteil ist die Bedingung der Unabhän- 
gigkeit zwischen den Richtsprüchen der einzelnen Richter nicht erfüllt, und 
dies ändert wesentlich die Lage der Dinge“. 

Die Begeisterung für „Anwendungen“ dieser Art ohne genügende Berück- 
sichtigung des Wesens der gesellschaftlichen Erscheinungen, ohne Berücksich- 
tigung der sie determinierenden Seiten hat sich auf die Entwicklung der Wahr- 
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scheinlichkeitsrechnung hemmend ausgewirkt. Alle diese grundfalschen An- 
wendungen sind später als ein „mathematischer Skandal‘ eingeschätzt worden. 
Als Ergebnis dieser Mißerfolge machte die Begeisterung für die Wahrschein- 
lichkeitsrechnung einer Enttäuschung Platz, und unter den westeuropäischen 
Mathematikern war die Meinung weit verbreitet, daß die Wahrscheinlichkeits- 
rechnung nur eine Art mathematischer Unterhaltung sei, die keine wesentlichen 
wissenschaftlich begründeten Anwendungen zuläßt und nicht die Aufmerksam- 
keit ernsthafter Gelehrter verdient. Sogar die Erfolge der Wahrscheinlichkeits- 
rechnung in ihren ernsthaften Anwendungen — der kinetischen Gastheorie, 
der Fehlerrechnung, der Ballistik u. a. — konnten in Westeuropa nicht diese 
fehlerhaften Einschätzungen korrigieren. 

Es waren der Geist eines TSCHEBYSCHEW und die stürmische Entwicklung 
der Physik erforderlich, die an die Mathematik im allgemeinen und die Wahr- 
scheinlichkeitsrechnung im besonderen höchste Anforderungen stellte, um die 
Wahrscheinlichkeitsrechnung auf den Weg einer großen Wissenschaft zurück- 
zuführen, die mit speziellen Methoden große Gruppen von Erscheinungen der 
materiellen Welt untersucht. Unter dem reichen wissenschaftlichen Erbe des 
Schöpfers der nichteuklidischen Geometrie, N. I. LoBArscHuzwsekıs (1792—1856), 
sind zwei Arbeiten vorhanden, die sich auf die Wahrscheinlichkeitsrechnung 
beziehen. LoBATschzwskı hat sich nicht speziell mit der Wahrscheinlich- 
keitsrechnung befaßt, er interessierte sich für sie nur im Zusammenhang mit 
der Frage nach der Geometrie der uns umgebenden Welt. 

In seiner „Pangeometrie‘ schrieb LoBATSCHEWsK1T, daß man sich zur Erklä- 
rung der Eigenschaften des realen Raumes auf die Erfahrung stützen müsse: ‚,... 
die in der gewöhnlichen Geometrie offen oder verborgen angenommene Voraus- 
setzung, daß die Summe der Winkel eines jeden geradlinigen Dreiecks konstant 
ist, ist keine Folgerung aus unseren Begriffen über den Raum. Allein die Erfah- 
rung kann die Wahrheit dieser Voraussetzung bestätigen, z.B. durch eine 
Messung der Winkel eines geradlinigen Dreiecks .. .“. 

Da bei praktischen Beobachtungen zur Verkleinerung des Einflusses von 
Beobachtungsfehlern mehrere Messungen ausgeführt werden und ihr arith- 
metisches Mittel genommen wird, stellte LoBATscHzwskı folgende Aufgabe: 
Bekannt seien die Verteilungsfunktionen der einzelnen Fehler in n Messungen, 
man bestimme die Wahrscheinlichkeitsverteilung ihres arithmetischen Mittels. 
Wir sprachen bereits im Haupttext des Buches davon, daß LOoBATSCHEWSKI 
diese Aufgabe löste unter der Voraussetzung der Unabhängigkeit der Beobach- 
tungen und der gleichmäßigen Verteilung der Meßfehler im Intervall —1, +1. 

Einen wichtigen Schritt, der ein neues Feld der Wissenschaft eröffnete, tat 
P. L. TscHEBYscHzw (1821—1894). TsokeBYscHEw hat über das Gebiet der 
Wahrscheinlichkeitsrechnung im ganzen vier Arbeiten veröffentlicht; ihren Ein- 
fluß auf die weitere Entwicklung der Wissenschaft kann man schwerlich über- 
schätzen. Seine Ideen wirken bis in unsere Zeit fort, und eine vollständige 
Lösung der von ihm gestellten Aufgaben gelang erst in den letzten zehn bis 
fünfzehn Jahren. 
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Von der methodologischen Seite her besteht die von TSCHEBYSCHEW voll- 
zogene Umwälzung nicht darin, daß er als erster mit voller Konsequenz die 
Forderung nach absoluter Strenge in den Beweisen der Grenzwertsätze durch- 
setzte (die Beweise von MoIvRz, LArLAce und Poisson waren von der formal- 
logischen Seite aus nicht ganz überzeugend, übrigens im Unterschied zu dem 
Bernovztischen Satz, den BERNOULLLI selbst mit erschöpfender arithmetischer 
Strenge bewies). Sein großes Verdienst besteht hauptsächlich darin, daß er 
überall danach strebte, genaue Abschätzungen der Abweichungen von den 
Grenzgesetzmäßigkeiten zu gewinnen, die bei einer, wenn auch großen, so 
doch endlichen Anzahl von Versuchen möglich sind, und zwar in der Form von 
Ungleichungen, die bei einer beliebigen Anzahl von Versuchen unbedingt richtig 
sind. 

Ferner schätzte TsoBzsyschew als erster die Begriffe der Zufallsgröße 
und der mathematischen Erwartung einer Zufallsgröße richtig ein und nutzte 
sie vollständig aus. Diese Begriffe waren auch schon früher bekannt und sind 
abgeleitet von den Begriffen des Ereignisses und der Wahrscheinlichkeit. Jedoch 
genügen die Zufallsgrößen und ihre mathematischen Erwartungen einem sehr 
viel bequemeren und geschmeidigeren Algorithmus. Dies geht so weit, daß 
wir heute ständig an Stelle eines Ereignisses A seine charakteristische Zufalls- 
größe £, betrachten, die gleich Eins ist, wenn das Ereignis A eintritt, und gleich 
Null ist, wenn es nicht eintritt. Die Wahrscheinlichkeit P{A} des Ereignisses A 
ist nichts anderes als die mathematische Erwartung ME, der Größe &,. Die 
entsprechende Methode der charakteristischen Mengenfunktionen begann man 
systematisch in der Theorie der reellen Funktionen erst sehr viel später anzu- 
wenden‘ (A.N. Kormocororr, Die Rolle der Russischen Wissenschaft in der 
Entwicklung der Wahrscheinlichkeitsrechnung). 

Die TscHesyscazwschen Ideen fanden unter den ausländischen Wissen- 
schaftlern nicht sofort einen Widerhall, doch dienten sie als Anstoß zur Schaf- 
fung der russischen Schule der Wahrscheinlichkeitsrechnung. Dem Charakter 
der Untersuchungen nach läßt sich die Tätigkeit dieser Schule in zwei Perioden 
einteilen. Die erste ist mit den Namen von Mathematikern verbunden, die 
hauptsächlich in Petersburg lebten — P. L. Tsonesyscuew, A. A. Markow 
(1856—1922), A. M. Lsarunow (1857—1918) und später S. N. BERNSTEIN 
und W. I. Romanowskı. Diese Periode ist dadurch charakterisiert, daß sich die 
Hauptuntersuchungen um zwei Schemata konzentrierten —um das Schema einer 
Folge unabhängiger Zufallsgrößen und später um das Schema der Markowschen 
Ketten. Die zweite Periode begann nach der Großen Sozialistischen Oktober- 
revolution und ist mit der Arbeit einer Gruppe Moskauer Mathematiker ver- 
knüpft — es sind dies A. J. Cuintscumn, A. N. KoLMoGororr, E. E. SLUTZKI 
(1880—1948), N. W. Smirwow und ihre Schüler. Diese Periode ist dadurch 
charakterisiert, daß man in die Wahrscheinlichkeitsrechnung die Ideen und 
Methoden der Theorie der reellen Funktionen heranzog, daß man weitgehend die 
Mittel der Analysis benutzte, die Problematik wesentlich erweiterte und die 
Untersuchung einer Reihe von klassischen Aufgaben zum Abschluß brachte. 
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Wir sahen, daß die wahrscheinlichkeitstheoretischen Probleme in engem 
Zusammenhang mit zahlreichen Aufgaben der Naturwissenhaft, in erster 
Linie der Physik und der Technik stehen. Im Hinblick darauf führt eine Unter- 
suchung auf dem Gebiet der Wahrscheinlichkeitsrechnung und insbesondere auf 
dem Gebiet ihrer Anwendungen auf die Lösung einzelner spezieller Aufgaben, 
die bisweilen eine virtuosenhafte Beherrschung des mathematischen Apparates 
erfordern. Aus dem Chaos einzelner angewandter Probleme wurden die grund- 
legenden wahrscheinlichkeitstheoretischen Schemata herausgeschält, die es 
gestatten, eine große Anzahl vielfältiger konkreter Aufgaben mit allgemeinen 
Methoden zu behandeln. Diese Schemata verdienen auf Grund ihrer Allgemein- 
heit auch an und für sich eine tiefgehende und erschöpfende Untersuchung. 
Zu diesen besonders wichtigen Richtungen der modernen Wahrscheinlichkeits- 
rechnung muß man die folgenden Gebiete zählen: 


1. die Grenzwertsätze für Summen unabhängiger Zufallsgrößen, 
2. die Markowschen Ketten, 
3. die allgemeine Theorie der zufälligen Prozesse, 


4. die Zufallsfunktionen und zufällige Vektorfelder mit Verteilungen, die in 
bezug auf irgendeine Transformationsgruppe invariant sind, 


5. Informationstheorie. 
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Wertetabellen einiger in der Wahrscheinlichkeitsrechnung 
auftretender Funktionen 


= 


1. Wertetabelle der Funktion p(x) = 


Ver 


3984 | 3982 | 3980 
3945 | 3939 | 3932 
0,2 3910 3976 | 5867 | 3857 | 3847 
0,3 3814 3765 | 3752 | 3739 | 3726 
0,4 3683 3621 | 3605 | 3589 | 3572 
0,5 3521 3448 | 3429 | 4410 | 3391 
0,6 3332 3251 | 3230 | 3209 | 3187 
0,7 3123 3034 | 3011 | 2989 | 2966 
0,8 2897 2803 | 2780 | 2756 | 2732 
0,9 2661 2516 | 2492 
1,0 0,2420 2275 | 2251 
1,1 2179 2083 | 2059 | 2036 | 2012 
1,2 1942 1849 | 1826 | 1804 | 1781 
1,3 1714 1626 | 1604 | 1582 | 1561 
1,4 1497 1415 | 1394 | 1374 | 1354 
1,5 1295 1219 | 1200 ! 1182 | 1163 
1,6 1108 1040 | 1023 | 1006 | 0989 
1,7 0940 0878 | 0863 | 0848 | 0883 
1,8 0790 0734 | 0721 | 0707 | 0694 
1,9 0656 0584 | 0573 
2,0 0,0540 0478 | 0468 
| 2,1 0440 0404 | 0396 | 0387 | 0379 
| 2,2 0355 0310 | 0303 
2,3 0283 0241 
2,4 0224 0189 
2,5 0175 0147 
2,6 0136 0113 
2,7 0104 0086 
2,8 0079 
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2. Wertetabelle der Funktion ®(x) = re j e "ik 
Ye, 

© | 0 1 2 3 4 5 6 7 8 9 
0,0 10,00000 00399 | 00798 | 01197 | 01595 | 01994 | 02392 | 02790 | 03188 | 03586 
0,1 | 03983 | 04380 | 04776 | 05172 | 05567 | 05962 | 06356 | 08749 | 07142 | 07535 
0,2 07926 | 08317 | 08706 | 09095 | 09483 | 09871 | 10257 | 11026 | 10642 | 11409 
0,3 11791 | 12172 | 12552 | 12930 | 13307 | 13683 | 14058 | 14431 | 14803 | 16173 
0,4 15542 | 15910 | 16276 | 16640 | 17003 | 17364 | 17724 | 18082 | 18439 | 18793 
0,5 19146 | 19497 | 19847 | 20194 | 20540 | 20884 | 21226 | 21566 | 21904 | 22240 
0,6 22575 | 22907 | 23237 | 23565 | 23891 | 24215 | 24537 | 24857 [25175 | 25490 
0,7 25304 | 26115 | 26424 | 26730 | 27035 | 27337 | 27637 | 27935 | 28230 | 28524 
0,8 28814 | 29103 | 20389 | 29673 | 29955 | 30234 | 30511 | 30785 | 31057 |31327 
0,9 31594 | 31859 | 32121 | 32381 | 32639 | 32894 | 33147 |33398 | 33646 | 33591 
1,0 34134 | 34375 | 34614 | 34850 | 35083 | 35314 | 35543 | 35769 | 35993 | 36214 
1,1 | 36433 | 36650 | 36864 | 37076 | 37286 | 37493 | 37698 | 37900 | 38100 | 38298 
1,2 38493 | 38686 | 38377 | 39065 | 39251 | 39435 | 39617 | 39796 | 39973 | 40147 
1,3 40320 | 40490 | 40658 | 40824 | 40988 | 41149 | 41309 | 41466 [41621 | 41774 
1,4 41924 | 42073 | 42220 | 42364 | 42507 | 42647 | 42786 | 42922 | 43056 | 43189 
1,5 43319 | 43448 | 43574 | 43699 | 43822 | 43943 | 44062 | 44179 | 44295 | 44408 
1,6 44520 | 44630 | 44738 | 44845 | 44950 | 45053 | 45154 | 45254 | 45452 | 45449 
1,7 45543 | 45637 | 45728 | 45818 | 45907 | 45994 | 46080 | 46164 | 46246 | 46327 
1,8 46407 | 46485 | 46562 | 46638 | 46712 | 46784 | 46856 | 46926 | 46995 | 47062 
1,9 47128 | 47193 | 47257 | 47320 | 47381 | 47441 | 47500 | 47558 | 47615 | 47670 
2,0 47725 | 47778 | 47831 | 47882 | 47932 | 47982 | 48030 | 48077 |48124 | 48169 
2,1 48214 | 48257 | 48300 | 48341 | 48382 | 48422 | 48461 | 48500 | 48537 | 48574 
2,2 48610 | 48645 | 48678 | 48713 | 48745 | 48778 | 48809 | 48840 | 48370 | 48899 
2,3 48928 | 48956 | 48983 | 49010 | 49036 | 49061 | 49086 | 49111 | 49134 | 49158 
2,4 49180 | 49202 | 49224 | 49245 | 49266 | 49286 | 49305 | 49324 | 49343 | 49361 

| 236 49379 | 49396 | 49413 | 49430 | 49446 | 49461 | 49477 | 49492 | 49506 | 49520 

\ 9,6 49534 | 49547 | 49560 | 49573 | 49585 | 49598 | 49609 | 49621 | 49632 | 49643 

| 937 49653 | 49664 | 49674 | 49683 | 49693 | 49702 | 49711 | 49720 | 49728 |49736 

| 2,8 49744 | 49752 | 49760 | 49767 | 49774 | 49781 | 49788 | 49795 | 49801 | 49807 

1238 49813 | 49819 | 49825 | 49831 | 49836 | 49841 | 49846 | 49851 | 49856 | 49861 
3,0 0,49865 3,1 49903 | 3,2 |49931 49952| 3,4 | 49966 
3,5 49977 3,6 49084 | 3,7 149989 49993|| 3,9 |49995 
4,0 499968 

| 45 499997 | 

50 49999997 | 


| 
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0,818731 | 0,740818 | 0,670320 | 0,606531 | 0,548812 
0,163746 | 0,222245 | 0,268128 | 0,303265 | 0,329287 
0,016375 | 0,033337 | 0,053626 | 0,075816 | 0,098786 
0,001091 | 0,003334 | 0,007150 | 0,012636 | 0,019757 
0,000055 | 0,000250 | 0,000715 | 0,001580 | 0,002964 
0,000002 | 0,000015 | 0,000057 | 0,000153 | 0,000356 
0,000013 | 0,000035 

0,000003 


0,496585 | 0,449329 | 0,406570 | 0,367879 0,049787 
0,347610 | 0,359463 | 0,365913 | 0,367879 | 0,270671 | 0,149361 
0,121663 | 0,143785 | 0,164661 | 0,183940 | 0,270671 | 0,224042 
0,028388 | 0,038343 | 0,049398 | 0,061313 | 0,180447 | 0,224042 
0,004968 | 0,007669 | 0,011115 | 0,015328 | 0,090224 | 0,168031 
0,000695 | 0,001227 | 0,002001 | 0,003066 | 0,036089 | 0,100819 
0,000081 | 0,000164 | 0,000300 | 0,000511 | 0,012030 | 0,050409 
0,000008 | 0,000019 | 0,000039 | 0,000073 | 0,003437 | 0,021604 
0,000002 | 0,000004 | 0,000009 | 0,000859 | 0,008101 

0,000001 | 0,000181 | 0,002701 

0,000038 | 0,000810 

0,000007 | 0,000221 

0,000001 | 0,000055 

0,000013 

0,000003 

0,000001 


0 
1 
2 
3 
4 
5 
6 
7 
8 
9 
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0 0,018316 
1 0,073263 
2 0,146525 
3 0,195367 
& 0,195367 
5 0,156293 
6 0,104194 
7 0,059540 
8 0,029770 
9 0,013231 

10 0,005292 

11 0,001925 

12 0,000642 

13 0,000197 

14 0,000056 

15 0,000015 

16 0,000004 

17 0,000001 

18 

19 

20 

21 

22 

23 

24 


vb 
19 0 


0,006738 
0,033690 
0,084224 
0,140374 
0,175467 
0,175467 
0,146322 
0,104445 
0,065278 
0,036266 
0,018133 
0,008242 
0,003434 
0,001321 
0,000472 
0,000157 
0,000049 
0,000014 
0,000004 
0,000001 


0,002479 
0,014873 
0,044618 
0,089235 
0,133853 
0,160623 
0,160623 
0,137677 
0,103258 
0,068838 
0,041303 
0,022529 
0,011262 
0,005199 
0,002228 
0,000891 
0,000334 
0,000118 
0,000039 
0,000012 
0,000004 
0,000001 


0,000912 
0,006383 
0,022341 
0,052129 
0,091226 
0,127717 
0,149003 
0,149003 
0,130377 
0,101405 
0,070983 
0,045171 
0,026350 
0,014188 
0,007094 
0,003311 
0,001448 
0,000596 
0,000232 
0,000085 
0,000030 
0,000010 
0,000003 
0,000001 


0,000335 
0,002684 
0,010735 
0,028626 
0,057252 
0,091604 
0,122138 
0,139587 
0,139587 
0,124077 
0,099262 
0,072190 
0,048127 
0,029616 
0,016924 
0,009026 
0,004513 
0,002124 
0,000944 
0,000397 
0,000159 
0,000061 
0,000022 
0,000008 
0,000003 
0,000001 


0,000123 
0,001111 
0,004998 
0,014994 
0,033737 
0,060727 
0,091090 
0,117116 
0,131756 
0,131756 
0,118580 
0,097020 
0,072765 
0,050376 
0,032384 
0,019431 
0,010930 
0,005786 
0,002893 
0,001370 
0,000617 
0,000264 
0,000108 | 
0,000042 | 
0,000016 
0,000006 
0,000002 
0,000001 | 


25* 


0 
1 
2 
3 
4 
5 
6 
7 
8 
9 
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0,995321 
0,999845 
0,999996 
1,000000 
1,000000 
1,000000 
1,000000 


0,496585 
0,844195 
0,965858 
0,994246 
0,999214 
0,999909 
0,999990 
0,999998 
1,000000 
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0,818731 
0,982477 
0,998852 
0,999943 
0,999998 
1,000000 
1,000000 
1,000000 


0,449329 
0,808792 
0,952577 
0,990920 
0,998589 
0,999816 
0,999980 
0,990999 
1,000000 


0,408570 
0,772483 
0,937144 
0,988542 
0,997657 
0,999658 
0,999958 
0,999997 
1,000000 


0,670320 


0,938448 


0,392074 
0,999224 
0,999939 
0,999996 
1,000000 
1,000000 


0,367879 
0,735759 
0,919699 
0,981012 
0,996340 
0,999406 
0,999917 
0,999990 
0,999999 
1,000000 


0,606531 
0,909796 
0,985612 
0,998248 
0,999828 
0,999986 
0,999999 
1,000000 


0,135335 
0,406006 
0,676677 
0,857124 
0,947348 
0,983437 
0,995467 
0,998904 
0,999763 
0,999954 
0,999992 
0,999999 
1,000000 
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0,977885 
0,997642 
0,999606 
0,999962 
0,999997 
1,000000 


0,049787 
0,199148 
0,423190 
0,647232 
0,815263 
0,916082 
0,966491 
0,988095 
0,996196 
0,998897 
0,999707 
0,999928 
0,999983 
0,999996 
0,999999 
1,000000 
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0,018316 
0,091579 
0,238105 
0,433472 
0,628839 
0,785132 
0,889326 
0,948866 
0,978636 
0,991867 
0,997159 
0,999084 
0,999726 
0,999923 
0,999979 
0,999994 
0,999998 
0,999999 
0,999999 
0,999989 
1,000000 
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0,265026 
0,440493 
0,615960 
0,762183 
0,866628 
0,931806 
0,968172 
0,986205 
0,994547 
0,997981 
0,999202 
0,999774 
0,999931 
0,999980 
0,999993 
0,999998 
0,999999 
0,999999 
1,000000 


0,017352 
0,061970 
0,151205 
0,285058 
0,445681 
0,606304 
0,743981 
0,847239 
0,916077 
%957380 
0,979909 
0,991173 
0,996372 
0,998600 
0,999491 
0,999825 
0,999943 
0,999982 
0,999994 
0,999998 
0,999999 
0,999999 
1,000000 


0,007295 
0,029636 
0,081765 
0,172991 
0,300708 
0,449711 
0,598714 
0,729091 
0,830496 
0,901479 
0,946650 
0,973000 
0,987188 
0,994282 
0,997593 
0,999041 
0,999637 
0,999869 
0,999955 
0,999985 
0,999995 
0,999998 
0,999999 
0,999999 
1,000000 


0,013754 
0,042380 
0,099632 
0,191236 
0,313374 
0,452961 
0,592548 
0,716625 
0,815887 
0,888077 
0,936204 
0,965820 
0,982744 
0,991770 
0,996283 
0,998407 
0,999351 
0,999748 
0,999907 
0,999967 
0,999989 
0,999997 
0,999999 
0,999999 
1,000000 


0,006232 
0,021226 
0,054963 
0,115690 
0,206780 
0,323896 
0,455652 
0,587408 
0,705988 
0,803008 
0,875773 
0,926149 
0,958533 
0,977964 
0,988894 
0,994680 
0,997573 
0,998943 
0,999560 
0,999824 
0,999932 
0,999974 
0,999990 
0,999996 
0,999998 
0,999999 
1,000000 
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1 
k—2 
_— ih 
ci rn): 


0,8013 
5724 
3916 
2615 
1718 
1116 
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0,9994 
9915 
9643 
9114 
8343 
7399 
6371 
5341 
4373 
3505 
2757 
2133 
1626 
1223 
0909 
0669 
0487 
0352 
0252 
0179 
0126 
0089 
0062 
0043 
0030 
0020 
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0,9998 
9963 
9814 
9473 
8912 
8153 
7254 
6288 
5321 
4405 
5375 
2851 
2237 
1730 
1321 


1,0000 
0,9994 
9955 
9834 
9580 
9161 
8576 
7851 


1,0000 
0,9998 
9979 
9912 
9752 
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Fortsetzung 


1,0000 
1,0000 
1,0000 
1,0000 
1,0000 
1,0000 
0,9999 
9995 
9986 


1,0000 
1,0000 
1,0000 
1,0000 
1,0000 
1,0000 
1,0000 
0,9999 
9997 


oe 2 Ss 2 ar a» DB m 


30 9967 9993 
11 9929 9983 
12 9866 9964 
13 9765 9929 
14 9617 9872 
15 9414 9784 
16 9148 9658 
17 8818 9486 
18 8429 9261 
19 7971 9981 
20 7468 8645 
21 6926 8253 
22 6357 7813 
23 5776 7330 
24 5194 6815 
25 4624 6278 
26 4076 5730 
27 3559 5182 
28 3079 4644 
29 2639 4125 
30 2243 3632 
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= 
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0,087577 
0,098656 
0,110395 
0,122760 
0,135718 
0,149229 
0,163225 
0,177753 
0,192677 
0,207987 
0,223637 
0,239582 
0,255780 
0,272189 
0,288765 
0,305471 
0,322265 
0,339113 
0,355981 


Wertetabelle der Funktion X(«) 


0,372833 
0,389640 
0,406372 
0,423002 
0,439505 
0,455857 
0,472041 
0,488030 
0,503808 
0,519366 
0,534682 
0,549744 
0,564546 
0,579070 
0,593316 
0,607270 
0,620928 
0,634286 
0,647338 
0,660082 
0,672516 
0,684636 
0,696444 
0,707940 
0,719126 
0,730000 
0,740566 
0,750826 
0,760780 
0,770434 
0,779794 
0,788860 
0,797636 
0,806128 
0,814342 
0,822282 
0,829950 
0,837356 
0,844502 
0,851394 
0,858038 
0,864442 
0,870612 
0,876548 
0,882258 
0,887750 
0,893030 


0,898104 
0,902972 
0,907648 
0,912132 
0,916432 
0,920556 
0,924505 
0,928288 
0,931908 
0,935370 
0,938682 
0,941848 
0,944872 
0,947756 
0,950512 
0,953142 
0,955650 
0,958040 
0,960318 
0,962486 
0,964552 
0,966516 
0,968382 
0,970158 
0,971846 
0,973448 
0,974970 
0,976412 
0,977782 
0,979080 
0,980310 
0,981476 
0,982578 
0,983622 
0,984610 
0,985544 
0,986426 
0,987260 
0,988048 
0,988791 
0,989492 
0,990154 
0,990777 
0,991364 
0,991917 
0,992438 
0,992928 
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0,993389 
0,993828 
0,994230 
0,994612 
0,994972 
0,995309 
0,995625 
0,995922 
0,996200 
0,996460 
0,996704 
0,996932 
0,997146 
0,997348 
0,997533 
0,997707 
0,997870 
0,998023 
0,998145 
0,998297 
0,998421 
0,998536 
0,998644 
0,998744 
0,998837 
0,998924 
0,999004 
0,999079 
0,999149 
0,999213 
0,999273 
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0,999329 
0,999380 
0,999428 
0,999474 
0,999516 
0,999252 
0,999588 
0,999620 
0,999650 
0,999680 
0,999705 
0,999723 
0,999750 
0,999770 
0,999790 
0,999806 
0,999822 
0,999838 
0,999852 
0,999864 
0,999874 
0,999886 
0,999896 
0,999904 
0,999912 
0,999920 
0,999926 
0,999934 
0,999940 
0,999944 
0,999949 


0,999954 
0,999958 
0,999962 
0,999965 
0,999968 
0,999970 
0,999973 
0,999976 
0,999978 
0,999980 
0,999982 
0,999984 
0,999986 
0,999987 
0,999988 
0,999989 
0,999990 
0,999991 
0,999992 
0,9999925 
0,9999956 
0,9999974 
0,9999984 
0,9999990 
0,9999994 
0,9999997 
0,99999982 
0,99999990 
0,99999994 
0,99999997 
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